Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Проверка статистических гипотез

No description
by

Yana Bazhenova

on 5 December 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Проверка статистических гипотез

Проверка статистических гипотез
Статистическая гипотеза
 (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистической гипотезы
 (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Статистический тест или статистический критерий
 — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.
Пусть задана случайная выборка  — последовательность  объектов из множества  . Предполагается, что на множестве   существует некоторая неизвестная вероятностная мера .
Методика состоит в следующем.
Методика проверки статистических гипотез
1.
Формулируется нулевая гипотеза   о распределении вероятностей на множестве  . Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы —основная или нулевая    и альтернативная  . Иногда альтернатива не формулируется в явном виде; тогда предполагается, что   означает «не  ». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
2.
Задаётся некоторая статистика (функция выборки)  , для которой в условиях справедливости гипотезы   выводится функция распределения   и/или плотность распределения  . Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика  . Вывод функции распределения   при заданных   и   является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для  ; в статистических пакетах имеются готовые вычислительные процедуры.
3.
Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число  . На практике часто полагают 
4.
На множестве допустимых значений статистики   выделяется критическое множество  наименее вероятных значений статистики  , такое, что  . Вычисление границ критического множества как функции от уровня значимости   является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
5.
Собственно статистический тест (статистический критерий) заключается в проверке условия:
если  , то делается вывод «данные противоречат нулевой гипотезе при уровне значимости  ». Гипотеза отвергается.
если  , то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости  ». Гипотеза принимается.
Альтернативная методика на основе достигаемого уровня значимости
Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.
Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия  

где   — критическая область критерия.
Другая интерпретация: достигаемый уровень значимости  — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем  
Если достигаемый уровень значимости достаточно мал (близок к нулю), то нулевая гипотеза отвергается. В частности, его можно сравнивать с фиксированным уровнем значимости; тогда альтернативная методика будет эквивалентна классической.

Типы критической области
Обозначим через   значение, которое находится из уравнения  , где    — функция распределения статистики  . Если функция распределения непрерывная строго монотонная, то   есть обратная к ней функция:

Левосторонняя критическая область
:

определяется интервалом 
пи-величина: 
Правосторонняя критическая область
:

определяется интервалом 
пи-величина: 
Двусторонняя критическая область:

определяется двумя интервалами 
пи-величина: 
Ошибки первого и второго рода
Ошибка первого рода или «ложная тревога» (англ. type I error,  error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна. Вероятность ошибки первого рода:

Ошибка второго рода или «пропуск цели» (англ. type II error,  error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна. Вероятность ошибки второго рода:

Свойства статистических критериев
Мощность критерия
:   — вероятность отклонить гипотезу  , если на самом деле верна альтернативная гипотеза  . Мощность критерия является числовой функцией от альтернативной гипотезы  .
Несмещённый критерий
:   для всех альтернатив   или, что то же самое для всех альтернатив  .
Состоятельный критерий
:  при    для всех альтернатив  .
Равномерно более мощный критерий
. Говорят, что критерий с мощностью   является равномерно более мощным, чем критерий с мощностью  , если выполняются два условия:
1.
2.   для всех рассматриваемых альтернатив  
Типы статистических гипотез
Простая гипотеза
 однозначно определяет функцию распределения на множестве . Простые гипотезы имеют узкую область применения, ограниченную критериями согласия (см. ниже). Для простых гипотез известен общий вид равномерно более мощного критерия (Теорема Неймана-Пирсона).

Сложная гипотеза 
утверждает принадлежность распределения к некоторому множеству распределений на Х. Для сложных гипотез вывести равномерно более мощный критерий удаётся лишь в некоторых специальных случаях.
Типы статистических критериев
Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.
Параметрические критерии предполагают
, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
Непараметрические критерии
 не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.
Критерии согласия:
Критерий Колмогорова-Смирнова
Критерий хи-квадрат (Пирсона)
Критерий омега-квадрат (фон Мизеса)
Критерии сдвига:
Критерий Стьюдента
Критерий Уилкоксона-Манна-Уитни

Критерии нормальности:
Критерий Шапиро-Уилка
Критерий асимметрии и эксцесса

Критерии однородности:
Критерии однородности предназначены для проверки нулевой гипотезы о том, что две выборки (или несколько) взяты из одного распределения, либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.
Критерии симметричности:
Одновыборочный критерий Уилкоксона и его модификации: критерий Антилла-Кёрстинга-Цуккини, критерий Бхаттачария-Гаствирса-Райта
Критерий знаков
Коэффициент асимметрии
Full transcript