Давайте взглянем на схожее исследование по оценке диеты и факторов риска, чтобы понять, какими бывают эффективные попытки сделать поправки на смешанные величины, а также то, как исследователи демонстрируют относительную эффективность таких поправок. Изучив исследование диеты и здоровья более чем 500 тысяч человек, проведенное Национальным центром исследования здоровья Американской ассоциации пенсионеров, и проведя анализ полученных данных путем разделения участников исследования на квинтили по уровню потребления красного мяса, а также других особенностей образа жизни, исследователи заметили, что по мере того как возрастало потребление красного мяса, росло и возникновение многообразия известных факторов риска для здоровья, таких как курение, недостаточная физическая активность и потребление алкоголя[86]
.Пока, как мы видим, информация совпадает с приведенной в предыдущем примере. Но в данном конкретном исследовании появился интересный дополнительный массив данных: он показывал коэффициент риска различных негативных для здоровья факторов для каждого квинтиля потребления мяса, а также соответствующий коэффициент риска для случайных смертей (смертей без медицинской причины, например, в результате автомобильной аварии или насилия). А посему изменения в риске для случайных смертей могут быть признаны не связанными с пищевыми привычками.
К примеру, если рассматривать конкретно мужское население, то риск случайной смерти возрастает по мере роста потребления красного мяса. Это в целом согласуется с темой, что люди, поедающие красное мясо, также склонны к другим опасным занятиям, которые «засоряют» полученный массив данных. Но дальше становится по-настоящему интересно: авторы затем попытались внести поправки на смешанные величины, чтобы изолировать эффект красного мяса. При сравнении пятого квинтиля с первым риски случайной смерти составляли 1.24 (p =.01) до поправок, а после поправок на смешанные величины он вырос до 1.26 (p =.008).
Значимость этого вывода заключается в том, что если бы ученые из исследования успешно учли все смешанные величины, коэффициент риска до поправок в 1.24 должен был бы снизиться до 1.00. Поскольку случайные смерти вызваны не выбором потребляемых продуктов питания, они по логической необходимости являются побочным продуктом смешанных величин. Следовательно, если бы воздействие смешанных величин было полностью устранено, не должно было быть обнаружено статистически значимых различий в рисках для К1 и К5. Но их корректировка вдруг
Оставим за скобками статистические ошибки и неспособность полностью учесть переменные величины и рассмотрим указанные коэффициенты рисков, поместив их в контекст. Это соотношения, указывающие относительный риск наступления негативного события (в контексте нашего анализа – смерти) при сопоставлении нескольких групп людей. Оба исследования калибровали первый квинтиль (самое низкое потребление мяса) как 1.0. Для каждого последующего квинтиля соотношение риска смерти сравнивалось с первым квинтилем.
В первом исследовании окончательно выведенный и скорректированный авторами коэффициент риска для максимального потребления необработанного красного мяса составил 1.23. Во втором исследовании 1.31. Вы можете спросить, как эти соотношения сравниваются с поведением, которое, как хорошо известно, на самом деле вызывает негативный для здоровья результат: курение и рак легких. Для человека, выкуривающего более 1,5 пачки сигарет в день по сравнению с некурящим, коэффициент риска развития рака легких составляет более 108[87]
. То есть наУ вас может возникнуть впечатление, что мы находим вышеупомянутые исследования по питанию не просто бесполезными, а вредными, – и будете правы. Вы можете возразить, что эти исследования стоили потраченных денег, потому что они предоставляют людям больше данных, из которых можно делать выводы. Если бы данные были представлены непредвзято, этот аргумент имел бы смысл. Но это явно
Рассмотрим первое исследование, где у холестерина прослеживался тренд на снижение по мере увеличения потребления красного мяса. Он также означает, что холестерин снижался по мере возрастания риска смерти. Учитывая предыдущие два тренда, данные также могли быть организованы таким образом, чтобы риск смерти сокращался по мере возрастания уровня холестерина у участника.