Умение выполнять последовательность решения задач анализа данных : сбор первичных данных, очистка и оценка качества данных, выбор и построение модели, преобразование данных, визуализация данных, интерпретация результатов (Ким 27 ЕГЭ, А -простая )
учитель МБОУ СОШ с.Тербуны
Тербунского муниципального округа
Липецкой области
Болгова Наталья Анатольевна
Высокий уровень, 40 мин, 2 балла (вопрос 1-1 балл, вопрос 2 -1 балл)
Разбираем вопрос 1 (часть А, 1 балл)
- Открыть файл 27_А
- Вставить в электронные таблицы (Excel-Calc)
- Разделить данные на 2 столбца (Данные-текст по столбцам, разделитель- пробел)
- Построить точечную диаграмму (для определения точек и границ кластеров)
MS Excel
LibreOffice Calc
- Разделить х, у в 2 столбца
- Вставка – диаграмма –
XY(разброс)
LibreOffice Calc
3. Отображать оси Ох, Оу
4. Отображать сетки
5. По оси ПКМ – формат оси-
Масштаб -Основной интервал - 1
LibreOffice Calc
6. Изменить размер точки
(ПКМ – Формат рядов данных)
7. Линии – Ширина, высота
0.05
результат
Для программы
1) В Блокноте удалить первую строку «Х, Y»
2) Правка – заменить «,» на «.»
3) Скопировать файл в PyCharm
Задача 27-1
Будем называть центром кластера точку в нём, сумма расстояний от которой до всех остальных точек кластера минимальна. У каждого кластера есть гарантированно единственный центр. Расстояние между двумя точками на плоскости A(x1,y1)) и B(x2,y2)) вычисляется по формуле:
В файле A хранятся данные о звёздах двух кластеров, где H=6,W=4, для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: Px — сумму абсцисс центров кластеров, и Py — сумму ординат центров кластеров .
В ответе запишите четыре числа: в первой строке — сначала абсолютную величину целой части произведения Px×10000, затем абсолютную величину целой части произведения Py×10000
Задача 27-1
1. Создаем 2 кластера точек из файла
Задача 27-1
2. Добавим функцию поиска расстояния между 2-мя точками
Примечание: функцию get_distant пишем после списков, так как идет чтение данных из файла!
Задача 27-1 (часть А)
3. Добавим функцию поиска центроида
def get_centroid (c): r = [ ] #создаем пустой список внутри кластера #находим сумму расстояний от точки p до всех остальных точек этого кластера for p in c: r = r + [(sum (get_distant(p, p1) for p1 in c), p )] # добавляем в список r кортеж(суммарное расстояние, точка (её координаты)) print( 'min =' , min(r))
# выводим мин расстояние и координаты точки return min(r)[1] # возвращаем только точку
Центроид кластера 1
Центроид кластера 2
Расстояние, точка
Вопрос 1: Для файла А определите координаты центра каждого кластера, затем найдите 2 числа: Px — сумму абсцисс центров кластеров, и Py — сумму ординат центров кластеров
В ответе записываем только целую часть или добавляем функцию int в программу
Вариант 2 - для интерпретатора python выше версии 3.8
Примечание: файл 27_1.txt должен находиться в одной папке с программой!
Варианты задач (часть А)
Задача 27-4 (часть А)
Будем называть центром кластера точку в нём, сумма расстояний от которой до всех остальных точек кластера минимальна. У каждого кластера есть гарантированно единственный центр. Расстояние между двумя точками на плоскости A(x1,y1)) и B(x2,y2)) вычисляется по формуле:
В файле A хранятся данные о звёздах двух кластеров, где H=6,W=4, для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: Px — максимальную из абсцисс центров кластеров, и Py — максимальную из ординат центров кластеров.
В ответе запишите четыре числа: в первой строке — сначала абсолютную величину целой части произведения Px×10000, затем абсолютную величину целой части произведения Py×10000
Строим диаграмму
10
Литература
- Сайт Константина Полякова «ЕГЭ по информатике 2022» , задание 27. [https://kpolyakov.spb.ru/school/ege.htm]
- Алексей Кабанов «Решение задач 27 КИМ ЕГЭ» [https://ya.ru/video/preview/9420930261881413251]
- Образовательный портал «Яндекс ЕГЭ», задание 27 [ https://education.yandex.ru/ege/inf/tasks?task_id=9a457c6a-b3e8-44f5-a91c-8b86e95dc71b&sort_by=newFirst&category_id=52bf01df-e110-4a2a-a907-c8a0b0763ed4&level=0&source=04188803-8ba8-42c5-af24-38f816d192f8 ]