Представляет собой интерес расчет коэффициента корреляции между качественными признаками, выражающий наличие признака или его отсутствие.
Если обозначить наличие признака через «1», а его отсутствие – через «0», то получим:
где m>X – количество наблюдений признака X в выборке n.
где m>Y – количество наблюдений признака Y в выборке n.
где m>XY – количество одновременно наблюдаемых признаков в выборке n.
Тогда:
Этот метод применим в биологии, медицине, племенном деле. Пусть, к примеру, производится селекция лошадей по масти. Если необходимая масть наблюдается, то обозначим ее через 1, а если отсутствует, то через 0. Обозначим множество родителей через Х, а множество потомков через Y (табл. 15).
Другим простым показателем степени взаимосвязи между двумя статистическими рядами является индекс Фехнера.
Для определения этого показателя нужно найти по каждому ряду отклонение от средней и выразить их через (+) и (-). Каждая пара наблюдений X и Y будет характеризоваться совпадением знаков: ++, – или несовпадением знаков: + – , – +. Обозначив число совпадений знаков через «а» и число несовпадений – «b», получим индекс Фехнера i по следующей формуле:
Таблица 15
Число отклонений, равных нулю, следует поделить пополам, половину отнести к «а», а половину к «b». Этот индекс можно использовать и для изучения связи между качественными признаками. Обратившись к предыдущему примеру, можно рассчитать индекс Фехнера, если значение 1 принять за (+), а значение 0 – за (-). В этом случае мы должны считать число всех совпадений X и Y, а таких совпадений будет 15:
Результаты получены почти одинаковые, в обоих случаях подтверждается связь средней силы.
Тесноту множественной корреляционной связи характеризует совокупный коэффициент корреляции R>yx1x2 x.
Для линейной множественной корреляции совокупный коэффициент корреляции может быть определен на основе использования коэффициентов парной корреляции и β-коэффициентов:
где R>yx1 – коэффициент парной корреляции; βi – стандартизованные коэффициенты регрессии.
В нашем примере, на основании данных табл. 14, расчет выглядит следующим образом:
Полученный коэффициент множественной корреляции показывает, что связь изучаемых факторов с себестоимостью молока очень тесная. Коэффициент детерминации, равный R>2, характеризует, что 92 % вариации себестоимости молока объясняется совместным влиянием включенных в уравнение факторов.