Статистика и котики - страница 8

Шрифт
Интервал


Чтобы вычислить этот критерий, нужно построить так называемые таблицы сопряженности. В простейшем случае это таблицы 2х2, в каждой ячейке которых – количество (или, по-научному, частота) песиков и котиков определенного размера. Впрочем, бывают таблицы сопряженности и с большим количеством столбцов и строчек.



Очевидно, что если котики и песики как биологические виды не отличаются по размеру, то больших котиков должно быть столько же, сколько и больших песиков (в процентном соотношении). И основная идея критерия Хи-квадрат состоит в том, чтобы сравнить такую таблицу, в которой песики не отличаются от котиков (иначе – таблицу теоретических частот), с той, что есть у нас (таблицей эмпирических частот).



Перво-наперво необходимо получить таблицу теоретических частот. Для этого для каждой ячейки подсчитывается теоретическая частота по такой формуле.



Следующим шагом мы смотрим, насколько сильно различаются между собой соответствующие ячейки в наших таблицах. Делается это вот так.



Квадрат в числителе этой формулы убирает знак, а знаменатель приводит Хи-квадрат в нужную размерность. Заметим, что если теоретическая частота равна эмпирической, то, применив эту формулу, мы получим 0.

Последним шагом мы складываем все получившиеся значения. Это и будет Хи-квадрат Пирсона. Чем он больше, тем сильнее отличаются песики от котиков.



Помимо всего вышеперечисленного существуют и другие статистические критерии, которые позволяют нам определить, чем песики отличаются от котиков. Они, как правило, имеют разные механизмы вычисления и требования к данным. Но вне зависимости от того, каким критерием вы воспользовались, мало просто его вычислить. Необходимо еще и уметь его интерпретировать. И этому вопросу будет посвящена следующая глава.


НЕМАЛОВАЖНО ЗНАТЬ!

Статистика и пиво. История Уильяма Госсета


В 1899 году пивоваренная компания «Гиннесс» взяла на работу молодого выпускника Оксфорда Уильяма Госсета, специализировавшегося в области химии и математики. И Госсет с энтузиазмом занялся изучением особенностей выращивания и обработки ячменя и хмеля, проводя небольшие, но частые эксперименты.



Надо сказать, что статистика в это время активно развивалась. Было разработано большое количество методов, которые, впрочем, не совсем подходили Госсету. Это происходило в силу малочисленности выборок растительных культур, используемых им в исследованиях. Поэтому в 1904 году Госсет отправился за советом в Лондонскую биометрическую лабораторию, которой руководил Карл Пирсон, один из самых видных статистиков XIX и XX веков. Их совместная переписка, продолжавшаяся вплоть до смерти Пирсона, внесла огромный вклад в развитие методов обработки данных.