Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ - страница 76

Шрифт
Интервал


показывает среднюю разницу между значением «отклика» и средним значением у тех объектов, у которых значение независимой переменной больше среднего на единицу. В тех случаях, когда исследователь готов постулировать причинно-следственную связь, говорят, что β>1 показывает, как в среднем изменится значение «отклика» при росте значения объясняющей переменной x на единицу.

В большинстве случаев в регрессиях, особенно построенных по пространственным выборкам, трудно (если вообще возможно) говорить об отсутствии неучтенных переменных, которые оказывают значимое влияние на зависимую переменную, а также каким-либо образом связаны с другими объясняющими переменными. Возникающее при их наличии смещение приводит к неверной оценке регрессионных коэффициентов, причем направление и размер смещения заранее не известны исследователю. Учесть в анализе такой набор факторов, чтобы объекты анализа (индивиды, фирмы, государства) стали сопоставимыми, а переменные, включенные в регрессионное уравнение, не транслировали влияние третьих факторов, не включенных в спецификацию, призвана множественная регрессия.

Таким образом, множественная регрессия может рассматриваться как удобный метод сравнительных политологических исследований, основанных на идее сравнения сравнимого. Естественно, массив данных в рамках регрессионного анализа также трактуется как выборка, а получаемые регрессионные коэффициенты считаются выборочными оценками, на основе которых необходимо осуществлять статистический вывод.

Однако не всегда интересующая исследователя зависимая переменная является непрерывной. Диапазон возможных значений многих показателей зачастую бывает ограничен. Например, некоторые экономические показатели неотрицательны, а на ряд вопросов в социологических анкетах предусмотрены лишь несколько вариантов ответа: «да» или «нет»; «согласен», «не знаю» или «не согласен».

В таких случях оценивание классической модели линейной регрессии некорректно и даже ошибочно. Задачу выявления связи между зависимой переменной, которая принимает только два значения (1 – «успех» (в статистическом смысле), 0 – «неуспех»), и рядом предикторов решают модели бинарного выбора. В общем случае, когда есть несколько категорий «отклика», но их количество мало, используются модели множественного упорядоченного и неупорядоченного выбора.