Практическое занятие №51 (1И)
Тема: Практика вычисления описательных статистических величин в Python Pandas
Цель работы: формирование теоретических и практических навыков работы на языке программирования Python
Оборудование: компьютер с установленной операционной системой Windows, подключение к сети Интернет
Время работы 2 часа
Ход работы
Сначала вам нужно загрузить библиотеку pandas:
import pandas as pd # Import pandas library to Python
Вам также нужно будет создать фрейм данных pandas, который позже сможете использовать в синтаксисе примера.
data = pd.DataFrame({'x1':[1, 7, 5, 3, 7, 2, 7, 9], # Create pandas DataFrame
'x2':range(0, 8),
'group1':['A', 'B', 'B', 'A', 'C', 'C', 'B', 'A'],
'group2':['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b']})
print(data) # Print pandas DataFrame
Следующий код демонстрирует, как вычислить среднее значение для каждого столбца фрейма данных pandas по группам.
Для этой задачи вы можете использовать функции groupby и mean, как показано ниже:
print(data.groupby('group1').mean()) # Get mean by group
В этом примере объясняется, как вычислить среднее значение для каждого столбца на основе двух групповых столбцов.
Для этого вы должны указать имена столбцов группы в виде списка в функции groupby:
print(data.groupby(['group1', 'group2']).mean())
Следующий синтаксис объясняет, как использовать функцию describe для вычисления таких показателей, как количество, среднее, минимальное, максимальное и различные квантили по группам.
Сделайте это:
print(data.groupby('group1').describe())