Статистика: учебное пособие - страница 34

Шрифт
Интервал


Представляет собой интерес расчет коэффициента корреляции между качественными признаками, выражающий наличие признака или его отсутствие.

Если обозначить наличие признака через «1», а его отсутствие – через «0», то получим:

где m>X – количество наблюдений признака X в выборке n.

где m>Y – количество наблюдений признака Y в выборке n.

где m>XY – количество одновременно наблюдаемых признаков в выборке n.

Тогда:

Этот метод применим в биологии, медицине, племенном деле. Пусть, к примеру, производится селекция лошадей по масти. Если необходимая масть наблюдается, то обозначим ее через 1, а если отсутствует, то через 0. Обозначим множество родителей через Х, а множество потомков через Y (табл. 15).

Другим простым показателем степени взаимосвязи между двумя статистическими рядами является индекс Фехнера.

Для определения этого показателя нужно найти по каждому ряду отклонение от средней и выразить их через (+) и (-). Каждая пара наблюдений X и Y будет характеризоваться совпадением знаков: ++, – или несовпадением знаков: + – , – +. Обозначив число совпадений знаков через «а» и число несовпадений – «b», получим индекс Фехнера i по следующей формуле:

Таблица 15

Число отклонений, равных нулю, следует поделить пополам, половину отнести к «а», а половину к «b». Этот индекс можно использовать и для изучения связи между качественными признаками. Обратившись к предыдущему примеру, можно рассчитать индекс Фехнера, если значение 1 принять за (+), а значение 0 – за (-). В этом случае мы должны считать число всех совпадений X и Y, а таких совпадений будет 15:

Результаты получены почти одинаковые, в обоих случаях подтверждается связь средней силы.

Тесноту множественной корреляционной связи характеризует совокупный коэффициент корреляции R>yx1x2 x.

Для линейной множественной корреляции совокупный коэффициент корреляции может быть определен на основе использования коэффициентов парной корреляции и β-коэффициентов:

где R>yx1 – коэффициент парной корреляции; βi – стандартизованные коэффициенты регрессии.

В нашем примере, на основании данных табл. 14, расчет выглядит следующим образом:

Полученный коэффициент множественной корреляции показывает, что связь изучаемых факторов с себестоимостью молока очень тесная. Коэффициент детерминации, равный R>2, характеризует, что 92 % вариации себестоимости молока объясняется совместным влиянием включенных в уравнение факторов.