Корреляционный анализ – это углубление регрессионного метода; он позволяет определить тесноту связи между исследуемыми признаками, оценить правильность выбора типа линии регрессии и дает возможность сопоставить несколько уравнений регрессии.
Под корреляционным анализом понимается совокупность методов, состоящих из двух групп. Первая группа – методы измерения тесноты связей, требующие соблюдения определенных условий: отдельные наблюдения должны быть независимы и распределены по нормальному или близкому к нормальному закону распределения. Они предполагают вычисление таких показателей, как коэффициент парной корреляции, совокупный коэффициент множественной корреляции, частный коэффициент корреляции и корреляционное отношение.
Вторая группа методов – так называемые непараметрические методы, их применение не требует соблюдения каких-либо условий. Их применяют в том случае, когда изучаемые признаки не имеют количественной оценки, т. е. при изучении тесноты связей между качественными признаками.
При изучении линейной связи между двумя количественными признаками используют понятие коэффициента корреляции, который рассчитывается по формуле:
где cov (XY) – ковариация переменных x и у, т. е. их изменение, обусловленное взаимным влиянием.
В общем виде cov (XY) = E(Δx × Δy), где E – знак математического ожидания.
Практически ковариация рассчитывается как среднее произведение отклонения переменных X и Y от их средних значений, т. е.
Знаменатель формулы коэффициента корреляции представляет среднее квадратическое отклонение переменных X и Y, которые могут быть определены следующим образом:
Следовательно, коэффициент корреляции может быть получен исходя из следующего выражения:
Все формулы равносильны, и любая из них может быть использована для расчета коэффициента корреляции.
Следует заметить, что коэффициент корреляции может принимать значения от -1 до +1. Знак коэффициента корреляции характеризует направление связи (прямая – знак «+»), (обратная – знак «-»), а абсолютная его величина характеризует тесноту связи. В экономических исследованиях при значении коэффициента корреляции свыше 0,7 связь считается тесной, а ниже 0,3 – слабой.
В нашем примере по данным табл. 14 коэффициенты парной корреляции между себестоимостью молока и факторами, влияющими на нее, будут следующие: