Статистические характеристики
В жизни нам постоянно приходится сталкиваться с анализом больших массивов данных. Сбор информации касается всех областей жизнедеятельности человека: экономики, финансовой деятельности, медицины, транспорта, описания природных явлений и т.д.. Это могут быть данные о спросе или предложении какого-либо товара, данные переписи населения, частота рождения мальчиков и девочек, место страны в списке по качеству жизни и т.п..
Обработкой и анализом подобной информации занимается специальная наука (из раздела математики) – статистика , предоставляя обществу статистическую информацию (сводную документированную информацию о количественной стороне массовых социальных, экономических, демографических, экологических и других общественных процессов)
Статистика – наука о сборе, обработке и анализе статистической информации
Математическая статистика – наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.
Процесс познания окружающего мира включает наблюдение и эксперимент . Результаты того или иного процесса можно представить последовательностью чисел. Математические понятия, с помощью которых описываются особенности результатов называют статистическими характеристиками .
К статистическим характеристикам относятся:
мода, медиана, размах, среднее арифметическое .
Среднее арифметическое
Среднее значение (среднее арифметическое) является одной из основных характеристик статистического ряда. Оно позволяет узнать среднюю величину наблюдаемого показателя и является основой для проведения дальнейшего анализа данных.
Для расчета среднего значения необходимо сложить все значения ряда и разделить эту сумму на количество наблюдений. Формула для расчета среднего значения выглядит следующим образом:
среднее значение = (сумма значений) / (количество наблюдений)
Среднее значение является числом, которое может быть как целым, так и дробным
Например :
Двенадцать семиклассников попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные:
23, 18, 25, 20, 25,25, 32, 37, 34, 26, 34, 25.
Определим, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре. Для этого найдём среднее значение рассматриваемого ряда чисел:
ср.значение = ( 23+18+25+20+25+25+32+37+34+26+34+25) / 12 = 27
Размах
Размах - это разница между наибольшим и наименьшим значениями в статистическом ряду.
Он позволяет определить диапазон отклонения данных и оценить их распределение.
В приведенном выше примере время, затраченное на выполнение домашнего задания существенно отличается от 27 мин., т.е. от среднего арифметического:
23, 18 , 25, 20, 25,25, 32, 37 , 34, 26, 34, 25
наибольший расход времени равен 37 минут, а
наименьший - 18 минут.
Разность между наибольшим и наименьшим расходом времени составляет 19 минут (37 – 18) . Следовательно, размах ряда равен 19 .
Размах является простой и удобной мерой для оценки отклонений данных. Он характеризует стабильность, однородность исследуемых свойств.
Однако, размах не учитывает все значения в статистическом ряду.
Мода
Иногда важно знать не среднее арифметическое выборки (статистического ряда чисел), а то, какая из ее вариант (элемент выборки) встречается наиболее часто.
Например : менеджеру магазина одежды не важен средний размер продаваемых футболок, ему необходима информация о том, какие размеры наиболее популярны. Для этого используется такой показатель, как
мода выборки (статистического ряда) .
Мода ряда – это число, наиболее часто встречающееся в ряду.
Для ряда чисел 23, 18, 25 , 20, 25 , 25 , 32, 37, 34, 26, 34, 25 таким числом является число 25 .
Ряд чисел может иметь более одной моды, а может не иметь моды совсем.
Например , в ряду чисел 47, 46, 50, 52, 47, 52, 49, 45, 43, 53, 53, 47, 52 две моды — это числа 47 и 52
В ряду чисел 69, 68, 66, 70, 67, 62, 71, 74, 63, 73, 72 моды нет .
Медиана
Иногда, среднее арифметическое не вполне адекватно отражает ситуацию того или иного статистического исследования. Это происходит из-за наличия в выборке (результате исследования) чисел очень сильно отличающихся от среднего.
Например , при расчете средней зарплаты. Так, из-за огромных зарплат некоторых начальников большинство рядовых сотрудников обнаруживают, что их зарплата ниже средней. В таких случаях целесообразно использовать такую характеристику, как медиана ряда ..
Медианой упорядоченного статистического ряда чисел ( записанного по возрастанию чисел, его ещё называют ранжированный ряд ) с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.
Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.
медиана = (5 + 5):2 = 5. У ряда 12, 13, 14, 12, 15, 16, 14, 13, 11 медиана = 13 (т.к. упорядочив его : 11, 12,12,13, 13 , 14,14,15,16 , посередине стоит число 13 ) " width="640"
Для вычисления медианы необходимо
выполнить следующие шаги:
упорядочить статистический ряд по возрастанию (можно по убыванию);
если количество элементов в ряду нечетное, то медианой будет значение, расположенное в середине упорядоченного ряда;
если количество элементов в ряду четное, то медианой будет средние арифметическое двух значений, расположенных посередине данного упорядоченного ряда.
Например : Ученик имеет следующие оценки по алгебре:
5, 4, 2, 5, 7, 4, 4, 5, 5, 5 . Найдите медиану этого набора.
Первое что нужно сделать – это упорядочить ряд : 2,4,4,4, 5,5 ,5,5,5,5; затем находим число, расположенное посередине, а их в данном случае два: это 5 и 5 = медиана = (5 + 5):2 = 5.
У ряда 12, 13, 14, 12, 15, 16, 14, 13, 11 медиана = 13
(т.к. упорядочив его : 11, 12,12,13, 13 , 14,14,15,16 , посередине стоит число 13 )
Рассмотренные основные статистические характеристики выборки, а именно
среднее арифметическое, мода , медиана
называются мерами центральной тенденции. Они позволяют одним числом указать значение, относительно которого группируются все числа ряда.