Масштабные рандомизированные контролируемые иссследования
Дин Орниш
Широко распространено ошибочное мнение, что чем больше масштаб исследования, тем достовернее его результаты, а рандомизированное контролируемое исследование (РКИ) вообще считается золотым стандартом. Однако постепенно выясняется, что размер не всегда имеет значение и что в рандомизированных исследованиях тоже бывают свои ошибки и заблуждения. Нам нужны более креативные схемы проведения экспериментов.
Основной вопрос любого исследования: «Какова вероятность того, что разные результаты у экспериментальной и контрольной группы – следствие нашего воздействия, а не случайность?» Обычно если вероятность случайности ниже 5 %, то результаты исследования считаются статистически значимыми – то есть в самом деле удалось обнаружить нечто новое.
РКИ основано на следующей концепции: если вы случайным образом соберете экспериментальную группу, участники которой подвергнутся определенному воздействию, и контрольную группу (воздействовать на которую не будете), то все погрешности и искажения в измерениях (как уже известные, так и неизвестные), которые могли бы повлиять на исход, проявятся в обеих группах с равной вероятностью. В теории это звучит хорошо, но на практике РКИ свойственен собственный набор погрешностей, подрывающих надежность полученных результатов.
Например, планируется РКИ, которое должно определить, какое влияние оказывают изменения в питании на уровень риска сердечных и раковых заболеваний. Исследователи отбирают участников эксперимента согласно определенному критерию – к примеру, только людей, которые сразу по нескольким показателям входят в группу риска с точки зрения подверженности таким заболеваниям. Перед началом исследования пациентов тщательно инструктируют и задают им вопрос: «Если вас случайным образом распределят в экспериментальную группу, будете ли вы готовы внести изменения в свой режим питания?» Чтобы принять участие в исследовании, будущий участник эксперимента должен ответить утвердительно.
Однако если впоследствии этот пациент окажется в
К тому же в масштабных РКИ часто бывает сложно в достаточном объеме предоставить всем участникам поддержку и ресурсы для формирования нового образа жизни. Потому и аккуратность выполнения инструкций будет не столь высока, как ожидалось по результатам пилотного исследования (проведенного, разумеется, на группе меньшего размера).
В результате (a) сокращается вероятность того, что экспериментальная группа внесет необходимые изменения в свой образ жизни, и (б) возрастает вероятность того, что контрольная группа, наоборот, изменит свой образ жизни. А это, в свою очередь, сокращает разницу в результатах между двумя группами и делает результат исследования менее статистически значимым. И вывод о том, что изменение образа жизни оказывает лишь незначительное влияние на вероятность заболеваний, может оказаться ошибочным. Это так называемая «ошибка второго типа»: разница в результатах действительно была, но формат исследования не позволил ее зафиксировать.
Именно это и произошло с исследованием изменений в диете, которое было проведено «Программой в области здоровья женщин» (