Но предположим, что каждая переменная измеряется
Грамотный статистик умеет призвать к порядку и мешающие параметры. Если вы интересуетесь новостями науки, то наверняка читали об исследователях, «удерживающих на постоянном уровне» или «статистически контролирующих» какой-нибудь мешающий параметр. Самый простой способ сделать это называется мэтчингом[362]
. Связь демократии и мира загрязнена массой мешающих параметров: тут и благосостояние, и образование, и торговля, и членство в международных организациях. Давайте рассмотрим один из них, благосостояние; его можно измерить как ВВП на душу населения. Предположим, что каждой демократической стране в нашей выборке мы сопоставили автократию с тем же уровнем ВВП на душу населения. Если мы сравним средние индексы миролюбия для демократий со средними индексами для их автократических двойников, мы измерим влияние демократии на мир, удерживая благосостояние на постоянном уровне. Логика мэтчинга очевидна, но для применения этого метода требуется большой набор кандидатов, из которого можно было бы выбирать подходящие пары; с каждым новым мешающим параметром он должен быть все больше. Это может сработать для эпидемиологического исследования с десятками тысяч участников, но не для политологического исследования в мире, где всего 195 государств.Более общая техника называется множественной регрессией; она опирается на тот факт, что мешающий параметр никогда не коррелирует с предполагаемой причиной
Дальше проделаем то же самое для предполагаемого следствия, то есть миролюбия. Сопоставляем индекс миролюбия с мешающим параметром (график справа вверху), измеряем отклонения регрессии, отбрасываем первоначальные данные и заменяем их отклонениями, то есть величиной, на которую реальная миролюбивость каждой из стран отличается от ожидаемой, вычисленной на основе уровня благосостояния. Последний шаг очевиден: сопоставить первые остатки со вторыми (нижний график). Если корреляция значительно отличается от нуля, можно решиться на вывод: удерживая благосостояние на постоянном уровне, демократия действительно является причиной мира.
То, что вы только что наблюдали, — самая суть подавляющего большинства статистических методов, применяемых в эпидемиологии и социальных науках, и называется это основной линейной моделью. Конечный результат ее применения — уравнение, позволяющее предсказать эффект на основании взвешенной суммы предикторов (некоторые из них, предположительно, являются причинами). Обладая хорошим пространственным воображением, можно представить себе прогноз не в виде прямой, но в виде наклонной