Олимпиады для учителей, учеников и дошкольников! Специальные наградные, результаты сразу, комфортное участие.

СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Выбрать материалы

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Была в сети 06.05.2026 22:08

Капустина Наталья Степановна

учитель начальных классов

743

82 399

Подписчики

Подписки

Местоположение

Россия, Брянск

Специализация

Начальные классы

Обо мне Блог Файлы Тесты Галерея Активность Награды

Проверка статистических гипотез

Категория: Алгебра

24.08.2023 17:57

реферат написан во время обучения в ВУЗе, возможно кому-то пригодится

Просмотр содержимого документа
«Проверка статистических гипотез»

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего образования

«БРЯНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИМЕНИ АКАДЕМИКА И.Г. ПЕТРОВСКОГО»

Институт педагогики и психологии

Факультет педагогики и психологии

Кафедра теории и методики начального общего и музыкального образования

Реферат

Проверка статистических гипотез

Выполнила:

Капустина Наталья Степановна

обучающийся 4 курса,

заочной формы обучения(сокр.)

44.03.01 Педагогическое образование

(профиль Начальное образование)

Преподаватель:

профессор Тонких А. П.

Брянск 2021

Содержание

1.Статистические гипотезы: основные понятия. Шаги проверки гипотез…………………..3

2.Статистические гипотезы: основная и альтернативная………………………………….….3

3.Статистические критерии для проверки гипотез……………………………………………4

4.Уровень значимости α, ошибки первого и второго рода………………………….…...........4

5.Нахождение границ области принятия гипотезы……………………………………………5

6.Вывод о принятии или отвержении основной гипотезы……………………………………7

7.Проверка гипотезы о среднем генеральной совокупности…………………………………7

8.Проверка гипотезы о виде закона распределения выборки………………………………...9

9.Проверка гипотезы об однородности выборок…………………………………………….10

10.Проверка гипотез о законе распределения…………………………………………..……13

Критерий К.Пирсена………………………………………………………………………..….13

Критерий Мизеса……………………………………………………………………………….14

11.Доверительный интервал…………………………………………………………………..16

12. Функция риска……………………………………………………………………………...20

13.Заключение …………………………………………………………………………………22

12. Источники…………………………………………………………………………………..24

Понятия статистической гипотезы, нулевой и конкурирующей гипотез

Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известных распределений. Предположим, что на основании имеющихся данных есть основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача проверки статистической гипотезы заключается в подтверждении или опровержении этого предположения на основании выборочных (экспериментальных) данных.

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины , в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Если высказывается предположение, что случайная величина имеет нормальное распределение с дисперсией, равной единице, а математическое ожидание — число из отрезка , то это сложная гипотеза. Другим примером сложной гипотезы является предположение о том, что непрерывная случайная величина с вероятностью принимает значение из интервала , в этом случае распределение случайной величины может быть любым из класса непрерывных распределений.

Проверка статистической гипотезы означает проверку соответствия выборочных данных выдвинутой гипотезе. Параллельно с выдвигаемой основной гипотезой, рассматривают и противоречащую ей гипотезу, которая называется конкурирующей или альтернативной. Альтернативная гипотеза считается справедливой, если основная выдвинутая гипотеза отвергается.

Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается Н0.

Конкурирующей или альтернативной гипотезой называется гипотеза, которая противоречит основной гипотезе Н0 и обозначается Н1.

Например, основная гипотеза Н0 состоит в том, что математическое ожидание μ равно какому-то значению μ0. В этом случае конкурирующая гипотеза Н1 может состоять в предположении, что математическое ожидание μ не равно (больше или меньше) значения μ0:

Н0: μ=μ0; Н1: μ≠μ0, или Н1: μμ0, Н1: μ

Статистические гипотезы: основные понятия. Шаги проверки гипотез

Статистическая гипотеза - это некоторое предположение о свойствах генеральной совокупности, которое необходимо проверить. Статистические гипотезы выдвигаются, когда необходимо проверить, является ли наблюдаемое явление элементом случайности или результатом воздействия некоторых мероприятий.

Например, необходимо выяснить, значительно ли отличается средний объём продаж после проведения рекламной кампании от среднего объёма продаж после проведения рекламной кампании. Если ответ на этот вопрос положителен, то можно сделать вывод о том, что изменения являются результатом рекламной кампании.

Выводы, полученные путём проверки статистических гипотез, носят вероятностный характер: они принимаются с некоторой вероятностью. Статистическая гипотеза может быть также предположением о свойствах двух совокупностей, если, например, в ходе мероприятий имело место воздействие только на одну совокупность и необходимо сделать вывод о том, было ли это воздействие результативным.

Шаги проверки статистических гипотез следующие:

формулируется основная гипотеза H0 и альтернативная гипотеза H1;

выбирается статистический критерий, с помощью которого будет проверяться гипотеза;

задаётся значение уровня значимости α;

находятся границы области принятия гипотезы;

делается вывод о принятии или отвержении основной гипотезы H0.

Рассмотрим эти шаги и связанные с ними понятия подробнее.

Статистические гипотезы: основная и альтернативная

Основная гипотеза H0 - предположение о свойствах генеральной совокупности, которое является логичным и правдоподобным, но требует проверки. Основная гипотеза обладает "презумпцией невиновности", или точнее "презумпцией справедливости": пока не доказано, что её утверждение ложно, она считается истинной.

Альтернативная гипотеза H1 - утвержление о свойствах генеральной совокупности, которое принимается в случае, когда нет возможности принять основную гипотезу.

Приведём примеры того, как формулируются основная и альтернативная гипотезы.

Пример 1. До и после проведения рекламной кампании были собраны данные о среднем объём продаж.

Основная гипотеза H0: средний объём продаж до проведения рекламной кампании незначительно отличается от среднего объёма продаж после проведения рекламной кампании.

Альтернативная гипотеза H1: средний объём продаж изменился после проведения рекламной кампании.

Пример 2. После изменения конфигурации компьютерной сети были собраны случайным образом 200 замеров скорости передачи сообщений.

Основная гипотеза H0: изменение конфигурации не имело эффекта.

Альтернативная гипотеза H1: эффект от изменения статистически значим.

Статистические критерии для проверки гипотез

Статистический критерий - статистическая характеристика выборки, вычисляемая по некоторому математическому соотношению (формуле) на основе данных, имеющихся в выборке.

По значению этой характеристики принимается решение, принимать основную гипотезу или нет. Статистические критерии бывают двух видов:

односторонний критерий - критерий, значения которого принадлежат области (0; +∞);

двусторонний критерий - критерий, значения которого принадлежат области (-∞; +∞).

Свойства статистического критерия:

статистический критерий является случайной величиной, закон распределения которой известен. Зачастую в названии статистического критерия упоминается его закон распределения. Например, критерий хи-квадрат-Пирсона подчиняется закону распределения хи-квадрат;

чем ближе значение статистического критерия к нулю, тем более вероятно, что основная гипотеза является верной.

Уровень значимости α, ошибки первого и второго рода

Уровень значимости α - это вероятность ошибки первого рода. Значение уровня значимости обычно достаточно малое и задаётся аналитиком, проверяющим гипотезу. Чаще всего принимает значения 0,01 (1%), 0,05 (5%) и 0,1 (10%).

При проверке гипотезы всегда существует вероятность того, что будет сделано ошибочное заключение. Существуют два рода ошибки.

Ошибка первого рода - отвержение основной гипотезы при том, что она верна.

Ошибка второго рода - принятие основной гипотезы при том, что она ложна.

Со значением уровня значимости связано значение уровня доверия p.

Уровень доверия p - вероятность принятия верной гипотезы. Помним: пока не доказано, что основная гипотеза H0 является ложной, мы считаем её верной. Поэтому уровень значимости будет определять вероятность принятия основной гипотезы. Если уровень значимости α - вероятность отвержения верной гипотезы, то вероятность принятия верной гипотезы: p = 1 - α.

Аналитик сам управляет ошибкой первого рода - задаёт вероятность её наступления. Ошибкой второго рода он управлять не может - всегда существует вероятность того, что может быть принята неверная гипотеза. Поэтому, чтобы избежать нежелательных последствий от принятия неверной гипотезы, основная гипотеза формулируется таким образом, чтобы риск от последствий принятия неверной гипотезы был минимальным.

Пример 3. В лаборатории фармацевтического предприятия делается контрольный замер на соответствие контрольного состава лекарственных препаратов стандарту. Какие варианты гипотез могут быть предложены?

Решение.

Первый вариант.

Основная гипотеза H0 - лекарства соответствуют стандарту.

Альтернативная гипотеза H1 - лекарства не соответствуют стандарту.

Второй вариант.

Основная гипотеза H0 - лекарства не соответствуют стандарту.

Альтернативная гипотеза H1 - лекарства соответствуют стандарту.

В первом случае, принимая во внимание, что вероятность принятия основной гипотезы высока, мы имеем высокий риск нежелательных последствий принятия неверной гипотезы. Во втором случае, даже если мы будем вынуждены принять гипотезу, что лекарственные препараты не соответствуют стандарту, а на самом деле имеет место ошибка второго рода, придётся провести дополнительные контрольные замеры и более тщательно провести анализ химического состава. В любом случае, это повлечёт за собой более тщательный анализ, а риск нежелательных последствий может оказаться не столь значимым.

По причинам, которые мы выяснили в примере 3, статистические гипотезы часто формулируются следующим образом: "статистическая значимость между факторами незначима", "выборки незначимо отличаются по своим свойствам", "фактор не имеет значимого влияния на исследуемый процесс".

Статистика - не Ваша специализация? Закажите статистическую обработку данных

Нахождение границ области принятия гипотезы

Область принятия гипотезы (ОПГ) - подмножество таких значений критерия, при которых основная гипотеза не может быть отвергнута. Область принятия гипотезы всегда включает в себя значение 0.

Критическая область - подмножество таких значений критерия, при которых основная гипотеза не может быть принята.

В случае, если используется односторонний критерий, ОПГ включает в себя подмножество положительных значений критерия. В таком случае у критерия есть только одна критическая область.

В случае, если используется двусторонний критерий, который может принимать как положительные, так и отрицательные значения, у него имеются две критические области: подмножество отрицательных и подмножество положительных значений критерия, при которых гипотеза не может быть принята.

На этом шаге требуется найти такое подмножество значений критерия, к которому значение выбранного критерия будет принадлежать с вероятностью p. Точнее, необходимо найти крайние значения критерия в этом подмножестве.

Поэтому процедура нахождения границ области принятия гипотезы сводится к решению следующей задачи:

P{R'RR''}=1-α,

где

P{R'RR''} -

вероятность того, что значения критерия принадлежат области принятия гипотезы,

R' и R'' -

левое и правое критические значения области принятия гипотезы (критические точки).

Из этого получаем:

То есть задача решается путём взятия обратной функции от прямой функции распределения.

Обратным значением функции распределения с аргументом b является такое значение случайной величины a, при котором выполняется следующее условие:

В таком случае a называется квантилью функции распределения уровня b. Если левая и правые границы области - 1/4 и 3/4, то квантиль называется квартилью, если левая и правая границы области представляют собой дроби со знаменателем 10, то квантили называются децилями (понятия квартили, децилей, квинтилей и процентилей рассмотрены на уроке характеристики выборки и генеральной совокупности).

В случае с односторонним критерием получаем следующую формулу для нахождения критической точки:

Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.

Вывод о принятии или отвержении основной гипотезы

В случае, если значение критерия, найденное на выборочных значениях наблюдений принадлежит области принятия гипотезы, делается вывод о том, что нет возможности отвергнуть основную гипотезу.

В случае, если критерий принадлежит критической области, делается вывод о том, что нет возможности принять основную гипотезу. В таком случае принимается альтернативная гипотеза.

На рисунке ниже синим цветом изображена ось всевозможных значений критерия R, другие обозначения иллюстрируют попадание значения критерия в область принятия гипотезы или критическую область.

Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если в нескольких случаях критерий не смог попасть в область принятия гипотезы, то говорят, что получили согласованный результат и скорее всего гипотеза является ложной.

Проверка гипотезы о среднем генеральной совокупности

Часто бывает необходимо проверить, значимо ли отличается средний показатель совокупности от некоторого заданного значения, например, стандарта. В этом случае основная и альтернативная гипотезы могут быть записаны так:

;

При проверке гипотезы о среднем выборки в качестве статистического критерия часто применяется t-критерий Стьюдента, однако следует помнить, что этот критерий применим лишь тогда, когда данные выборки подчиняются нормальному закону распределения. Критические значения критерия, соответственно выбранному уровню значимости α и степени свободы v можно найти в приложениях книг по статистике, а если гипотеза проверяется с помощью компьютерной программы, например, STATISTICA, то программа выбирает его.

Нулевую гипотезу нет возможности отвергнуть с вероятностью P = 1 - α, если , где

- среднее выборки,

- некоторое заданное среднее значение, например, стандарт,

s - стандартное отклонение,

n - мощность выборки,

- критическое значение t-критерия Стьюдента.

Пример 4. Производитель кваса решил выяснить, работает ли устройство заполнения бутылок соответственно стандарту. Основная и альтернативные гипотезы сформулированы так:

Для проверки случайным образом выбрали 20 бутылок, средний незаполненный уровень составил мм, стандартное отклонение мм.

Так как выборка очень мала (20 единиц) и не известно стандартное отклонение генеральной совокупности, то выбран уровень доверия p = 95%.

Получаем фактическое значение статистического критерия:

Критическое значение t-критерия Стьюдента:

Так как , то есть фактическое значение статистического критерия меньше критического значения, то фактическое значение попадает в область принятия гипотезы. Следовательно, нет возможности отвергнуть основную гипотезу о том, что средний уровень незаполненности бутылки незначимо отличается от 50 мм.

В исследованиях нередки случаи необходимости сравнения средних в группах, одну из которых можно назвать "нормальной", а другую - далекой от "нормы", то есть нужно провести сравнение двух групп.

Проверка гипотезы о виде закона распределения выборки

Цель проверки гипотезы о виде закона распределения выборки - подобрать к распределению выборки известное теоретическое распределение и сделать вывод о распределении всей генеральной совокупности.

Статистические гипотезы для этой проверки формулируются следующим образом.

Основная гипотеза H0: распределение выборки незначимо отличается от предполагаемого (нормальное, экспоненциальное и др.).

Альтернативная гипотеза H1: распределение выборки значимо отличается от предполагаемого.

Критерий согласия показывает степень отличия эмпирической функции распределения (то есть значения, полученного из выборки) от гипотетической (теоретической, то есть предполагаемой до наблюдения). Чем меньше значение критерия, тем больше степень похожести эмпирического и теоретического распределений.

Применяются критерий хи-квадрат Пирсона и критерий Колмогорова-Смирнова. Однако существуют ограничения этих критериев. Для критерия хи-квадрат: в каждом интервале должно быть не менее 10 наблюдений. Для критерия Колмогорова-Смирнова: объём выборки должен быть более 50.

Формула оценки значения критерия хи-квадрат Пирсона:

где

m - число интервалов,

ai - число попаданий наблюдений в i-й интервал,

n - мощность выборки,

pi - вероятность попадания элемента в i-й интервал.

Число степений свободы df - число независимых элементов информации, используемых для вычисления стандартной ошибки.

Значение критерия Колмогорова-Смирнова рассчитывается следующим образом:

где

- эмпирическая функция распределения,

- теоретическая функция распределения.

Область принятия гипотезы:

где n - мощность выборки,

где α - уровень значимости.

Даже при проверке статистической гипотезы на компьютере область принятия гипотезы в этом случае нужно рассчитывать самостоятельно.

Существует также приближенный метод проверки гипотезы о нормальном распределении, который рассмотрен в статье о нормальном распределении.

Пример 5. Имеются данные некоторой выборки. Используя критерии хи-квадрат и Колмогорова-Смирнова, при уровне значимости α=0,05 проверить гипотезы о

а) нормальном распределении;

б) равномерном распределении.

Решение.

а) Получены следующие значения критериев:

критерий хи-квадрат: 2,72 (число степеней свободы: 4; границы ОПГ: (0; 5,99));

критерий Колмогорова-Смирнова: 0,08 (границы ОПГ: (0; 0,18)).

Вывод относительно проверяемой гипотезы: с вероятностью 95% принимается основная гипотеза о том, что генеральная совокупность распределена по нормальному закону.

б) Получены следующие значения критериев:

критерий хи-квадрат: 8,45 (число степеней свободы: 3; границы ОПГ: (0; 5,99));

критерий Колмогорова-Смирнова: 0,21 (границы ОПГ: (0; 0,18)).

Вывод относительно проверяемой гипотезы: с вероятностью 95% отвергается основная гипотеза о том, что генеральная совокупность распределена по равномерному закону.

Проверка гипотезы об однородности выборок

Существует два вида гипотез об однородности выборок. Может быть проверена однородность выборок "в слабом": выборки однородны "в слабом", если незначимо отличаются их параметры, прежде всего, среднее. Может быть проверена однородность выборок "в сильном": выборки однородны "в сильном", если незначимо отличаются их законы распределения.

С помощью критерия Стьюдента проверяется гипотеза об однородности выборок "в слабом". В этом случае основная гипотеза формулируется следующим образом: математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Формально это записывается так: .

Критерий рассчитывается по формуле:

где μ1 и μ2 - математические ожидания первой и второй выборок размерами n1 и n2 соответственно (в качестве оценок математических ожиданий берутся значения средних первой и второй выборок);

и - дисперсии первой и второй выборок;

df = n1 + n2 - 2 - число степеней свободы.

Критерий может принимать значения от минус бесконечности до плюс бесконечности. Чем ближе значения критерия к нулю, тем больше вероятность, что основная гипотеза будет верной (при этом знак не имеет значения).

Пусть задано значение уровня значимости α = 0,05. Тогда критерий будет принимать значения в области принятия гипотезы с вероятностью p = 1 - α (эта вероятность называется уровнем доверия). Вероятность того, что критерий примет значения меньшие, чем значение левой критической точки области принятия гипотезы равна α/2, а вероятность того, что критерий примет значение, меньшее, чем значение правой критической точки 1 - α/2. Значением левой критической точки области принятия гипотезы будет являться квантиль распределения Стьюдента уровня α/2 с df степенями свободы. Значением правой критической точки области принятия гипотезы будет выступать квантиль распределения Стьюдента уровня 1 - α/2 с тем же числом степеней свободы.

При проверке гипотезы об однородности выборок с помощью критерия Стьюдента необходимо помнить, что к выборкам выдвигаются допущение, нарушение которых не позволяет применить критерий:

выборки должны подчиняться нормальному распределению. Если это требование нарушается, то критерий не будет подчиняться распределению Стьюдента и, следовательно, границы области принятия гипотезы будут найдены неверно;

в выборках не должны присутствовать резко выделяющиеся наблюдения, иначе среднее значение будет смещено в сторону выбросов и в результате критерий даст некорректный результат.

Пример 6. Имеются данные некоторой выборки. По ним в пакете программных средств STATISTICA вычислены следующие показатели:

Среднее 1-й выборки	Среднее 2-й выборки	t-критерий	Число степеней свободы	p-level
19,60	28,21	-1,38	48	0,17

Область принятия гипотезы при уровне значимости α = 0,05: (-2,01; 2,01)

Сделать вывод об однородности выборок.

Ответ.

Значение t-критерия попадает в область принятия гипотезы. Может быть принята основная гипотеза о том, что математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Таким образом, проверена гипотеза об однородности выборок в слабом.

С помощью критерия Колмогорова-Смирнова проверяется гипотеза об однородности выборок "в сильном", то есть о том, что функции распределения выборок незначимо отличаются друг от друга. За основу критерия Колмогорова-Смирнова выступает статистика

максимальная по модулю разность между двумя функциями распределения выборок x и y.

Критерий рассчитывается по формуле

Границы области принятия гипотезы определяются следующим образом:

Если критерий принадлежит области принятия гипотезы, то при заданном уровне значимости α нет возможности её отвергнуть, следовательно, принимается гипотеза о том, что выборки однородны "в сильном".

Гипотезы об однородности выборок могут быть выдвинуты как в исследованиях поведения человека, так и технических науках.

Пример 7. По данным некоторой выборки получены следующие показатели:

Макс. отриц. разность	Макс. полож. разность	Значение критерия K.S.	p-level
-0,2	0,08	0,117	10

Область принятия гипотезы при уровне значимости α = 0,05: (0; 0,189)

Сделать вывод об однородности выборок.

Ответ.

Значение критерия попадает в область принятия гипотезы. Следовательно, принимается основная гипотеза о том, что функции распределения двух выборок незначимо отличаются. Таким образом, выборки однородны "в сильном".

Проверка гипотез о законе распределения

Критерий К. Пирсона

Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fп(x), которая приближенно подчиняется закону распределения c 2. Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда.

Итак, пусть выборка представлена статистическим рядом с количеством разрядов y . Наблюдаемая частота попаданий в i-й разряд ni. В соответствии с теоретическим законом распределения ожидаемая частота попаданий в i-й разряд составляет Fi. Разность между наблюдаемой и ожидаемой частотой составит величину (n i – Fi). Для нахождения общей степени расхождения между F(x) и Fп(x) необходимо подсчитать взвешенную сумму квадратов разностей по всем разрядам статистического ряда

Величина c 2 при неограниченном увеличении n имеет распределение хи-квадрат (асимптотически распределена как хи-квадрат). Это распределение зависит от числа степеней свободы k, т.е. количества независимых значений слагаемых в выражении. Число степеней свободы равно числу y минус число линейных связей, наложенных на выборку. Одна связь существует в силу того, что любая частота может быть вычислена по совокупности частот в оставшихся y – 1 разрядах. Кроме того, если параметры распределения неизвестны заранее, то имеется еще одно ограничение, обусловленное подгонкой распределения к выборке. Если по выборке определяются f параметров распределения, то число степеней свободы составит

k=y – f –1.

Область принятия гипотезы Н0 определяется условием c 2£ c 2(k;a ), где c 2(k;a ) – критическая точка распределения хи-квадрат с уровнем значимости a. Вероятность ошибки первого рода равна a , вероятность ошибки второго рода четко определить нельзя, потому что существует бесконечно большое множество различных способов несовпадения распределений. Мощность критерия зависит от количества разрядов и объема выборки. Критерий рекомендуется применять при n200, допускается применение при n40, именно при таких условиях критерий состоятелен (как правило, отвергает неверную нулевую гипотезу).

Для нормального закона возможные значения случайной величины лежат в диапазоне от – ¥ до ¥ , поэтому при расчетах оценок вероятностей крайний левый и крайний правый интервалы расширяются до – ¥ и ¥ соответственно. Вычислить значения функции нормального распределения можно, воспользовавшись стандартными функциями табличного процессора или полиномом наилучшего приближения.

Критерий Мизеса

В качестве меры различия теоретической функции распределения F(x) и эмпирической Fn(x) по критерию Мизеса (критерию w 2) выступает средний квадрат отклонений по всем значениям аргумента x

Статистика критерия

При неограниченном увеличении n существует предельное распределение статистики nw n2. Задав значение вероятности a можно определить критические значения nw n2(a ). Проверка гипотезы о законе распределения осуществляется обычным образом: если фактическое значение nw n2 окажется больше критического или равно ему, то согласно критерию Мизеса с уровнем значимости a гипотеза Но о том, что закон распределения генеральной совокупности соответствует F(x), должна быть отвергнута.

Достоинством критерия Мизеса является быстрая сходимость к предельному закону, для этого достаточно не менее 40 наблюдений в области часто используемых на практике больших значений nw n (а не несколько сот, как для критерия хи-квадрат).

Сопоставляя возможности различных критериев, необходимо отметить следующие особенности. Критерий Пирсона устойчив к отдельным случайным ошибкам в ЭД. Однако его применение требует группирования данных по интервалам, выбор которых относительно произволен и подвержен противоречивым рекомендациям. Критерий Колмогорова слабо чувствителен к виду закона распределения и подвержен влиянию помех в исходной выборке, но прост в применении. Критерий Мизеса имеет ряд общих свойств с критерием Колмогорова: оба основаны непосредственно на результатах наблюдения и не требуют построения статистического ряда, что повышает объективность выводов; оба не учитывают уменьшение числа степеней свободы при определении параметров распределения по выборке, а это ведет к риску принятия ошибочной гипотезы. Их предпочтительно применять в тех случаях, когда параметры закона распределения известны априори, например, при проверке датчиков случайных чисел.

Доверительный интервал

Точечные оценки являются приближенными, так как они указывают точку на числовой оси, в которой должно находиться значение неизвестного параметра. Однако оценка является приближенным значением параметра генеральной совокупности, которая при разных выборках одного и того же объема будет принимать разные значения, поэтому в ряде задач требуется найти не только подходящее значение параметра а, но и определить его точность и надежность.

Для этого в математической статистике используется два понятия – доверительный интервал и доверительная вероятность. Пусть для параметра а из опытных данных получена несмещенная оценка Требуется определить возможную при этом величину ошибки и вероятность того, что оценка не выскочит за пределы этой ошибки (надежность).

Зададимся некоторой вероятностью b (например, b = 0,99) и найдем такое значение e 0, для которого

Представим это выражение в виде

Это значит, что с вероятностью b точное значение параметра а находится в интервале l_e

Здесь параметр а – неслучайная величина, а интервал l_e является случайным, так как - случайная величина. Поэтому вероятность b лучше толковать, как вероятность того, что случайный интервал l_e накроет точку а. Интервал l_e называют доверительным интервалом, а вероятность b - доверительной вероятностью (надежностью).

Пример. Если при измерении какой-то величины Х указывается абсолютная погрешность Dх, то это, по существу, означает, что погрешность измерения, являясь случайной величиной, равномерно распределена в интервале (-Dх, Dх) и где Х* - измеренная величина, а х – ее точное значение. Здесь b = 1, e = Dх и l_e = (x*- Dх, x* + Dх).

Доверительный интервал для математического ожидания

В качестве еще одного примера рассмотрим задачу о доверительном интервале для математического ожидания. Пусть проведено n независимых опытов измерения случайной величины Х с неизвестным математическим ожиданием m_x и дисперсией s² . На основании опытных данных Х₁ , Х₂ , ... , Х_n построим выборочные оценки

Требуется построить (найти) доверительный интервал l_e , соответствующий доверительной вероятности b, для среднего генерального m_x .

Так как среднее выборочное представляет сумму n независимых одинаково распределенных случайных величин то при достаточно большом объеме выборки согласно центральной предельной теоремы ее закон близок к нормальному. Существует эмпирическое правило, по которому при объеме выборки n³ 30 выборочное распределение можем считать нормальным.

Ранее было показано, что Найдем теперь такую величину e(b) 0, для которой выполняется равенство

Считая случайную величину нормально распределенной, имеем

После замены имеем

По табличным значениям функции Лапласа Ф*(z) находим аргумент, при котором она равна b. Если этот аргумент обозначить Z_b , то тогда

Среднее квадратичное значение приближенно можно заменить

где

Таким образом, доверительный интервал для среднего генерального равен:

l_e =

Если пользоваться табличными значениями интеграла вероятностей

то доверительный интервал принимает вид

l_e =

Распределение Стьюдента

При малом объеме выборки (n

Для более точного получения доверительного интервала необходимо знать закон распределения случайной величины при малом объеме выборки. Для этого воспользуемся следующим результатом. Пусть Х₁ , Х₂ , ... , Х_n – выборка нормально распределенной случайной величины Х, тогда, как доказано, случайная величина

подчиняется распределению Стьюдента cn – 1 степенью свободы, плотность распределения которого имеет вид

где - гамма функция. Эта плотность, как видно из формулы, зависит только от числа опытов n. Ниже представлены графики плотностей нормированной (m_x = 0, s = 1) нормально распределенной и с распределением Стьюдента (n = 4) случайных величин.

нормальное распределение

распределение Стьдента

0,4

0,3

0,2

0,1

-4 -3 -2 -1 1 2 3 4 t

На основании найденных можно, пользуясь распределением Стьюдента, найти доверительный интервал для m_x , соответствующий доверительной вероятности b. Действительно, так как то

Пользуясь таблицей значений интеграла

по значению b найдем величину а следовательно, и сам доверительный интервал l_e =

Проверка статистических гипотез

Принятие решения о параметрах генеральной совокупности играет исключительно важную роль на практике. Рассмотрим вопрос о принятии решения на примере. Пусть фирма, выпускающая конденсаторы, утверждает, что среднее пробивное напряжение конденсаторов равно или превышает 300 В. Испытав 100 конденсаторов, мы получили, что среднее выборочное пробивное напряжение равно 290 В, а несмещенное выборочное среднее квадратичное отклонение s_n = 40 В. Можно ли с доверительной вероятностью 0,99 утверждать, что среднее пробивное напряжение превышает 300 В.

Здесь нас интересует односторонняя оценка – среднее пробивное напряжение должно превышать 300 В.

Выскажем статистическую гипотезу – генеральное среднее m_x = 300 В, а затем проверим, соответствует ли она результатам наблюдения. Поскольку объем выборки больше 30, то выборочное среднее можно считать гауссовской случайной величиной с генеральной дисперсией s² »s_n ² . Введем центрированную и нормированную величину

Утверждение о том, что среднее выборочное напряжение эквивалентно утверждению, что случайная величина

Найдем вероятность того, что гауссовская случайная величина Z с m_z = 0 и s_z = 1 принимает значения больше z_o :

Эта величина должна равняться доверительной вероятности 0,99. Тогда и по таблицам значений функции находим аргумент z_o = -2,33. Вычислим теперь наблюдаемое значение случайной величины Z:

Мы видим, что наблюдаемое значение z = - 2,5 нe принадлежит интервалу [-2,33;¥), поэтому гипотезу нужно отвергнуть.

Приведем пример гипотезы с двухсторонней оценкой. Пусть фирма, выпускающая стабилитроны определенного типа, утверждает, что номинальное напряжение стабилизации стабилитронов равно 10 В. Естественно, что отклонение напряжения стабилизации в меньшую или большую стороны одинаково нежелательно. Выдвинем гипотезу, что генеральное среднее напряжение стабилизации равно 10 В, а затем проверим эту статистическую гипотезу по результатам наблюдения.

Пусть при испытании 100 стабилитронов среднее выборочное равно 10,3 В, а несмещенное выборочное среднее квадратичное отклонение равно 1,2 В. Можно ли с доверительной вероятностью 0,95 считать выдвинутую гипотезу справедливой? Так как объем выборки больше 30, то можно, как и в предыдущем примере, ввести гауссовскую случайную величину Z. Найдем

и приравняем правую часть полученного соотношения 0,95. Тогда и z_o =1,96. Это значит, что наблюдаемое значение z должно принадлежать интервалу (-1,96; 1,96). Поскольку не попадает в указанный интервал, то гипотеза отвергается.

Если объем выборки n

Функция риска

доверительный интервал вероятность статистическая гипотеза

Пусть имеются две противоположные гипотезы Н_о и Н₁ и некоторая связанная с ними случайная величина Y. И пусть у - значение случайной величины Y, полученное в результате испытаний, которое принадлежит множеству D - множество всех значений случайной величины Y. Требуется провести проверку гипотезы Н_о относительно конкурирующей гипотезы Н₁ на основании результатов испытания.

Разобьем множество D на две части - D_о и D₁ с условием принятия гипотезы Н_о при попадании полученного значения у в D_о и гипотезы Н₁ - при попадании у в D_1.Выбор решающего правила, то есть разбиение множества Dна две части D_о и D₁в любой задаче проверки гипотез возможен больше, чем одним способом. Возникает вопрос, какое из этих разбиений в каждой конкретной задаче считать наилучшим? Чтобы решить поставленную задачу нужно обладать некоторой дополнительной информацией. Такая информация носит название априорной.

Будем считать известными два условных распределения вероятностей случайной величины Y:

- плотность распределения случайной величині Y при условии, что верна гипотеза Н_о ;

- плотность распределения случайной величині Y при условии, что верна гипотеза Н₁ ;

Кроме того нам потребуется априорная вероятность р того, что гипотеза Н_о имеет место.

Введем в рассмотрение события:

А – верна гипотеза Н_о , тогда р = р(А);

– верна конкурирующая гипотеза Н₁ , тогда р( ) = 1 - р;

В – в результате эксперимента значение у попало в интервал D_о ;

– в результате эксперимента значение у попало в интервал D₁ .

Тогда по результатам эксперимента возможны только четыре события:

АВ – верна гипотеза Н_ои принято решение о ее истинности;

В – верна гипотеза Н₁ , а принято решение о истинности гипотезы Н_о ;

А – верна гипотеза Н_о , а принято решение о истинности гипотезы Н₁ ;

– верна гипотеза Н₁ и принято решение о ее истинности.

Ясно, что события В и А определяют ошибочные решения. Событию В соответствует так называемая ошибка первого рода, а событию А - ошибка второго рода.

Для ответа на вопрос, какое из решающих правил следует считать лучшим, введем понятие функции потерь и функцию риска.

Функция потерь – дискретная случайная величина С, которая каждому из событий АВ, В, А , ставит в соответствие потери , выраженные в каких-то единицах. Правильному решению естественно положить нулевые потери, а ошибкам первого и второго ряда положить соответственно положительные потери (числа) С₁ и С₂ , которые нужно задать.

Пусть р_о = р(АВ или ), р₁ = р( В), р₂ = р(А ). Определение значений этих вероятностей будет проведено ниже. Ряд распределения для случайной величины С имеет вид

С	0	с₁	с₂
р	р_о	р₁	р₂

Определение. Математическое ожидание М(С) случайной величины С называется функцией риска и обозначается буквой r.

Таким образом, r = М(С) = 0 р_о + с₁ р₁+ с₂ р₂ = с₁ р₁+ с₂ р₂ .

Введение функции риска приводит к естественному выбору решающего правила. Из двух правил лучшим считается то, которое приводит к меньшему риску. Для нахождения минимума функции риска найдем вероятности р₁и р₂ :

Тогда

Для того, чтобы интеграл был минимальным, а значит и минимальное значение принимала функция риска r, нужно в состав D_о включить только те у, в которых подыинтегральная функция

С₁ (1-р) f₁ (y) – pC₂ f_o (y)

а в состав D₁ - остальные значения у.

Последнее неравенство можно записать в виде

Функция f₁ (y)/f_o (y) называется отношением правдоподобия.

Итак, оптимальное решающее правило заключается в следующем: полученное в результате эксперимента значение у подставляется в отношение правдоподобия f₁ (y)/f_o (y) и сравнивается с числом

l =

если полученное в результате вычисления число f₁ (y)/f_o (y) меньше l, принимается гипотеза Н_о ; в противном случае – гипотеза Н₁ .

Заключение

Обычно сущность проверки гипотезы о законе распределения ЭД заключается в следующем. Имеется выборка ЭД фиксированного объема, выбран или известен вид закона распределения генеральной совокупности. Необходимо оценить по этой выборке параметры закона, определить степень согласованности ЭД и выбранного закона распределения, в котором параметры заменены их оценками. Пока не будем касаться способов нахождения оценок параметров распределения, а рассмотрим только вопрос проверки согласованности распределений с использованием наиболее употребительных критериев.

При проверке гипотез о законе распределения следует помнить, что слишком хорошее совпадение с выбранным законом распределения может быть обусловлено некачественным экспериментом (“подчистка” ЭД) или предвзятой предварительной обработкой результатов (некоторые результаты отбрасываются или округляются).

Выбор критерия проверки гипотезы относительно произволен. Разные критерии могут давать различные выводы о справедливости гипотезы, окончательное заключение в таком случае принимается на основе неформальных соображений. Точно также нет однозначных рекомендаций по выбору уровня значимости.

Рассмотренный подход к проверке гипотез, основанный на применении специальных таблиц критических точек распределения, сложился в эпоху "ручной" обработки ЭД, когда наличие таких таблиц существенно снижало трудоемкость вычислений. В настоящее время математические пакеты включают процедуры вычисления стандартных функций распределений, что позволяет отказаться от использования таблиц, но может потребовать изменения правил проверки. Например, соблюдению гипотезы Н0 соответствует такое значение функции распределения критерия, которое не превышает значение доверительной вероятности 1– a (оценка статистики критерия соответствует доверительному интервалу). В частности, для примера 3.1 значение статистики критерия хи-квадрат равно 1,318. А значение функции распределения хи-квадрат для этого значения аргумента при трех степенях свободы составляет 0,275, что меньше доверительной вероятности 0,95. Следовательно, нет оснований отвергать нулевую гипотезу.