Хотя в скандалах вокруг корреляции и причинности виноватыми обычно считают тех, кто принимает первое за второе, зачастую проблема фундаментальнее: выходит так, что и корреляции-то не установлено. Не удивлюсь, если у туркменов, глодающих кости, зубы не крепче, чем у всех остальных (r = 0). Но не одним лишь президентам бывших советских республик не удается показать не только причинно-следственную связь, но и корреляцию. В 2020 г. Джефф Безос хвастал: «Все мои самые удачные решения и в бизнесе, и в жизни принимались сердцем, чутьем, по наитию… а не в результате анализа», что предполагает, что не анализ, а сердце и чутье подсказывают нам лучшие решения[335]
. Но Джефф, увы, не сообщил, как он принимал все свои худшие решения в бизнесе и в жизни — тоже сердцем, чутьем и по наитию? Как и не уточнил, превосходит ли суммарное число хороших интуитивных и плохих аналитических решений суммарное число плохих интуитивных и хороших аналитических.Иллюзорную корреляцию, как называется это когнитивное искажение, первыми обнаружили психологи Лоран и Джин Чэпмен в своей знаменитой серии экспериментов. Ученых заинтересовал вопрос, почему психотерапевты до сих пор массово используют пятна Роршаха и методику «Нарисуй человека», несмотря на то что ни одно из проведенных исследований не показало корреляции между результатами этих тестов и симптомами психических заболеваний. Коварные экспериментаторы попарно соединили истории болезни психиатрических больных с нарисованными ими человечками, хотя на самом деле истории были липовыми, а пары — случайными. Затем они попросили группу студентов отыскать в результатах какую-нибудь закономерность[336]
. Студенты, поддавшись собственным стереотипам, ошибочно предположили, что широкоплечих человечков рисовали гипермаскулинные пациенты, глазастых — параноики и так далее; они называли именно те взаимосвязи, которые «наблюдают» в своих пациентах профессиональные диагносты — и так же безо всякой связи с реальностью.Наши житейские представления переполнены иллюзорными корреляциями вроде того «факта», что отделения скорой помощи перегружены в полнолуния[337]
. Опасность совершить подобную ошибку особенно высока, если в качестве единиц анализа (точек в диаграмме рассеяния) используются месяцы и годы. Дело в том, что значения многих переменных растут и падают с течением времени. Скучающий студент юридического факультета Тайлер Виген написал программу, которая ищет в сети массивы данных с бессмысленными корреляциями, — просто чтобы продемонстрировать, как велико их число. Количество убийств при помощи горячих предметов или пара, например, хорошо коррелирует с возрастом обладательницы титула «Мисс Америка», а уровень разводов в штате Мэн колеблется вместе с уровнем потребления маргарина в США[338].Регрессия к среднему
Слово «регрессия» стало общепринятым обозначением корреляционного анализа, но связаны они не напрямую. Первоначально этот термин относился к особому, сопряженному с корреляцией явлению — регрессии к среднему. Этот повсеместно распространенный, но, на первый взгляд, парадоксальный феномен открыл викторианский ученый-универсал Фрэнсис Гальтон (1822–1911), который сопоставил рост детей со средним ростом родителей («средним по родителям», то есть со средним арифметическим ростов отца и матери), в обоих случаях внося поправку на среднюю разницу в росте мужчин и женщин. Гальтон обнаружил, что «если средний родительский показатель выше посредственного, дети обычно ниже родителей, если же средний родительский показатель ниже посредственного, дети обычно выше родителей»[339]
. Это до сих пор так, причем в отношении не только роста детей и родителей, но и коэффициента интеллекта детей и родителей и, если уж на то пошло, любых двух не идеально коррелирующих переменных. Экстремальное значение одной из них будет, как правило, соответствовать не-так-чтобы-экстремальному значению другой.Это не значит, что высокие родители производят на свет все более низкорослое потомство, и наоборот, так что однажды все дети мира выровняются по одной и той же отметке на косяке, и не видать нам больше ни жокеев, ни баскетболистов. Не стоит и ожидать, что IQ человечества сойдется на посредственных ста баллах, а гении и глупцы вымрут без следа. Вопреки регрессии к среднему человечество не скатывается ко всеобщей посредственности; дело в том, что хвосты распределения постоянно пополняются редкими очень высокими детьми родителей выше среднего и очень низкорослыми отпрысками родителей ниже среднего.