Далее оказывается, ваше исследование касается только вас лично и не может быть применено к другим людям, ведь их вкусы могут оказаться иными. Поэтому нам потребуется, чтобы те же самые пробы провели другие люди. И чем более разными они будут – молодыми и старыми, худыми и толстыми, больными и здоровыми – тем выше вероятность, что наша выборка будет отражать генеральную совокупность людей, употребляющих в пищу сыр, и, следовательно, меньше шанс, что выводы исследования будут искажены.
Затем выяснится, что нужно, чтобы количество проб было достаточно большим, ведь чем их меньше, тем выше вероятность ошибки, да и вкус каждого следующего куска оказывается все менее ярким. В математической статистике минимально приемлемым количеством проб или участников исследования оказывается 31, именно по достижении этого числа погрешность перестает маскировать реальный эффект.
Такой подход к статистическим исследованиям сам по себе очень хорошо доказан математически и эмпирически, не зря его относят к двум наивысшим уровням доказательности. Если такие исследования противоречат мнению экспертов, то какими бы светилами ни казались последние, правильным будет принимать к исполнению результаты опытов, а не мнения.
Клиническое исследование не делается в единственном экземпляре. Их может быть много и мало, они могут быть высокого качества и низкого. Качество исследования определяется четырьмя вышеприведенными характеристиками. Плохо спроектированное исследование следует игнорировать, а хорошо спроектированное – принимать к сведению, даже если оно противоречит вашей ранее сформированной картине мира.
Допустим, вы открыли статью, описывающую клиническое исследование – например, одну из тех, ссылки на которые приведены в этой книге. Убедились, что оно соответствует вышеприведенным критериям: дизайн адекватен задачам, в исследуемой и контрольной группах не менее полусотни правильно подобранных участников. Остается проинтерпретировать результат – понять, об эффективности чего речь и с какой достоверностью.
Самый простой и понятный показатель – это, конечно, проценты. Например, в каком-то исследовании пишут, что в изучаемой группе субъективное улучшение состояния произошло в 45 % случаев, а в плацебо-группе – в 30 %. Это удобно: мы сразу понимаем, что исследуемый метод или препарат лучше, чем плацебо. Но насколько? Наполовину?
Чаще для сравнений между двумя относительными величинами используется показатель OR – odds ratio, соотношение шансов. Если OR больше единицы, то говорят о положительном эффекте, если меньше – об отрицательном. Допустим, в каком-то исследовании говорится, что шансы улучшения состояния на антидепрессанте амитриптилине в 2,13 раза выше, чем на плацебо. Как это перевести в проценты? Пусть эффект плацебо срабатывает также в 30 % случаев. Шансы вычисляются по формуле
доля / (1 – доля),
в нашем случае O = 0,3 / (1–0,3) = 0,4286.
Шансы (odds) для амитриптилина будут равны
2,13 × 0,4286 ≈ 0,9140.
Далее, применив формулу шансов в обратную сторону, получаем проценты успешного исхода для амитриптилина: если плацебо помогает 30 % пациентам, то амитриптилин должен помогать
0,9140 / (1 + 0,9140) ≈ 0,4784,
то есть 47,84 % пациентам.
Еще раз упомяну, что эта часть необязательна. Если что-то непонятно, смело пропускайте.
К слову, в вопросах лечения психических расстройств OR, равный 2 и более, – это очень хороший результат, обычно он меньше (упомянутый амитриптилин считается наилучшим антидепрессантом по уровню эффекта, но практически не применяется из-за сложностей и опасности). Если мы хотим результат 95 %, то требуемый OR увеличивается на порядок, то есть с 2 до 20 и более, что кажется очень труднодостижимым.
Для оценки разницы средних значений между двумя группами, например между исследуемым методом и TAU, используется другая величина, называемая выраженность эффекта, effect size, обозначаемая как g или Cohen’s D. Она с бо́льшим трудом переводится в проценты, поскольку свидетельствует, что в данном исследовании группы сравнивались между собой, а не с каким-то базовым, нулевым значением. Показатель 0,2 считается малым эффектом, 0,5 – средним, 0,8 – высоким. Например, если в исследовании говорится что Cohen’s D для техники осо-знанности был равен 0,7 по сравнению с гипнотерапией, мы можем сделать вывод, что осознанность существенно лучше, чем гипнотерапия в лечении изучаемой группы заболеваний.
И наконец, не пугайтесь ссылок на исследования: благодаря информационным технологиям знакомство с ними стало простым и интересным. В этой книге ссылки даются в снос-ках (например, Zhang, Lee, Mak et al, 2021). Это фамилии главных авторов и год написания. Вводим их в поисковик и сразу получаем ссылку на само исследование. Если по одному из адресов обнаруживается неполный текст, по другой ссылке вполне может оказаться полный.