Задача
на тему:
«Статистичний аналіз даних»
Підготував:
Учень 11-А класу Орлов Максим
Вчитель: Борисенко М.В.
Задача
Користуючись таблицею урожайності насіння соняшнику в Україні, обчисліть розмах, середнє значення, медіану та моду даної вибірки. Побудуйте полігон частот та гістограму.
Рік | Урожайність, ц/га | Рік | Урожайність, ц/га |
1991 | 15 | 2003 | 11 |
1993 | 13 | 2004 | 9 |
1995 | 14 | 2005 | 13 |
1997 | 12 | 2006 | 14 |
1999 | 10 | 2007 | 12 |
2001 | 9 | 2008 | 15 |
2002 | 12 | 2009 | 15 |
Перш ніж приступити до обчислення показників вибірки, необхідно спочатку скласти варіаційний ряд.
1. Варіаційний ряд (порядкова статистика) – це ряд даних, впорядкований за незгасанням.
9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 14, 15, 15, 15.
Складемо частотну таблицю, використовуючи дані варіаційного ряду.
2. Частоти – це числа, які показують, скільки разів певна величина ознаки зустрічається у сукупності.
Урожайність, ц/га | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Частота | 2 | 1 | 1 | 3 | 2 | 2 | 3 |
Тепер ми маємо змогу обчислити показники вибірки, які нас цікавлять.
3. Розмах – це різниця між найбільшим та найменшим значенням вибірки.
Розмах = xmax - xmin
За нашими даними xmax = 15, xmin = 9
Отже, Розмах = 15 – 9 = 6
Далі необхідно знайти моду та медіану цієї вибірки. Для знаходження моди можна скористуватися частотною таблицею.
4. Мода – значення випадкової величини, що трапляється найчастіше в сукупності спостережень.
За даними частотної таблиці можна побачити, що найчастіше зустрічається два числа: 12 і 15.
Отже, модою даної вибірки є два числа: 12 і 15. У такому випадку можна стверджувати, що сукупність є мультимодальною.
5. Медіана – це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку.
Знайти значення медіани можна скориставшись варіаційним рядом.
9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 14, 15, 15, 15.
Маємо два числа: 12 і 13. Вони і є медіаною даної вибірки. Але якщо досліджуваними даними є числа, то медіаною допускається вважати і середнє арифметичне цих двох чисел. Тобто число:
= 12,5
також є медіаною.
Наступним знайдемо середнє значення.
6. Середнім значенням (вибірковим середнім) вибірки x1, x2, …, xn , є сума вибраних значень, поділена на кількість елементів вибірки:
, де n – кількість елементів вибірки.
Підставимо наші значення у формулу:
X = = 12,43
Число 12,43 і є середнім значенням даної вибірки.
Тепер побудуємо полігон частот і гістограму. Для цього будемо використовувати дані з частотної таблиці.
7. Полігон частот – один із способів графічного зображення ймовірності випадкової величини. Являє собою ламану, що сполучає точки з даними значеннями.
8. Гістограма – спосіб графічного зображення табличних даних. Являє собою діаграму, що складається з прямокутників без розривів між ними.