Статистика и котики - страница 9

Шрифт
Интервал




В 1907 году Госсет решился опубликовать свои наработки в журнале Пирсона «Биометрика». Фирма «Гиннесс» разрешила сделать это только на том условии, что никакие конкретные данные в нее не попадут, а сам автор возьмет себе псевдоним. Таким образом пивовар Уильям Госсет превратился в математика Стьюдента, чьим именем назван ряд статистических критериев и открытое им t-распределение.

К слову, превращение ученых и инженеров в профессиональных статистиков не является такой уж редкостью. Так, Рональд Фишер был биологом, Фрэнк Вилкоксон – химиком, а Чарльз Спирмен – психологом.

Глава 4.

Как понять, что песики отличаются от котиков

или p-уровень значимости

Предположим, что вы вычислили t-критерий Стьюдента. Или U-критерий Манна-Уитни. Или какой-нибудь другой. Как же по нему понять, действительно ли песики и котики различаются по размеру? Чтобы это выяснить, статистики используют весьма нетривиальный подход.

Во-первых, они делают предположение, что котики и песики как биологические виды абсолютно не отличаются друг от друга. Это предположение называется нулевой гипотезой.



Следующим шагом они вычисляют вероятность того, что две случайно выбранные группы котиков и песиков дадут значение критерия большее или равное тому, которое мы получили (чаще всего без учета его знака). Эта вероятность называется p-уровнем значимости.

Если p-уровень значимости меньше 5% (чаще записывается как 0,05), то нулевая гипотеза отвергается и принимается гипотеза о том, что котики и песики все-таки различаются. Такая гипотеза называется альтернативной.



Если же p-уровень значимости больше 0,05, то нулевая гипотеза не отвергается.



Однако, то, что она не отвергается, еще не значит, что она верна. Это означает только то, что в данном опыте мы не обнаружили значимых различий.

В специальных статистических программах p-уровень значимости вычисляется автоматически, и нам достаточно просто найти его в соответствующей таблице. Однако, если у вас таких программ нет, то вам придется пользоваться таблицами критических значений.

Работать с ними просто: найдите нужную строчку и посмотрите на значение критерия, которое там указано. Если то, что вы получили, превышает это значение, то котики и песики отличаются друг от друга. Правда, для этого правила есть исключения – это U-Манна-Уитни и родственные ему критерии.