Помните вечеринку в университете, где учатся 10 % инженеров и 90 % не инженеров? Некоторая дополнительная информация поможет оценить вероятность того, что человек с карманным протектором – инженер. Может быть, вы знаете, что хозяйка вечеринки некогда сильно поссорилась с инженером, поэтому больше не приглашает их на свои праздники. Возможно, вы в курсе, что 50 % студентов-медиков и тех, кто готовится поступать на медицинский факультет в этот университет, носят карманные протекторы. Такая информация позволяет сопоставлять первоначальные оценки базового показателя с новыми вводными. Количественная оценка этой обновленной вероятности становится применением вывода Байеса.
Мы больше не задаем простой, одночастный вопрос: «Какова вероятность того, что человек с карманным протектором – инженер?» Вместо этого ставим сложный вопрос: «Какова вероятность того, что человек с карманным протектором – инженер, учитывая информацию, что 50 % студентов-медиков носят такие же защитные приспособления?» Небольшое количество инженеров противопоставляется дополнительной косвенной информации о повсеместном распространении карманных протекторов.
Мы можем аналогичным образом обновить медицинские вопросы, например: «Какова вероятность того, что эта боль в горле служит признаком гриппа, учитывая, что я навещал больного три дня назад?» Или: «Какова вероятность того, что боль в горле – симптом сенной лихорадки, учитывая, что я был на открытом воздухе в разгар сезона пыльцы?» Мы мысленно делаем подобные обновления по своему усмотрению, но есть инструменты, которые помогают определить влияние новой информации. Проблема вот в чем: «наше усмотрение» заключается в том, что мозг не настроен на интуитивное получение точных ответов на эти вопросы. Он эволюционировал для решения целого ряда проблем, но задачи Байеса пока не входят в их число.
Только не это! Результат анализа оказался положительным!
Насколько серьезны подобные новости? Сложные вопросы, как этот, легко решаемы с помощью трюка, который я узнал в аспирантуре, – четырехпольных таблиц (или таблиц сопряженности признаков)[587]
. Их нелегко решить с помощью интуиции или догадок. Допустим, вы просыпаетесь утром, и все плывет перед глазами. Также предположим, что существует редкое заболевание –Чтобы проверить, есть ли у вас блурит, вы сдаете анализы крови, и они оказываются положительными. Вы с врачом пытаетесь решить, что делать дальше. Проблема в том, что лекарство от размытого зрения – хлорогидроксилен[588]
– в 5 % случаев дает серьезные побочные эффекты, в том числе невыносимый и постоянный зуд в той части спины, до которой невозможно дотянуться. (Есть лекарство, которое можно принимать против этого зуда, но тогда с вероятностью 80 % начнет зашкаливать артериальное давление.) 5 % не производят большого впечатления, и, возможно, вы готовы принять лекарство, чтобы избавиться от этого размытого зрения. (Эти 5 % – объективная вероятность первого вида, а не субъективная оценка, то есть цифра получена в результате отслеживания десятков тысяч пациентов, принимающих препарат.) Естественно, вы хотите точно знать, каковы прогнозы на то, что вы действительно больны, прежде чем начать пить лекарство с риском постоянно чесаться.Четырехпольная таблица поможет разложить информацию так, чтобы она вся была перед глазами, и ее понимание не потребует от вас большего образования, чем восемь классов школы. Если цифры и дроби приводят вас в бешенство, не волнуйтесь: в приложении есть все детали, а в этой главе дается общее представление (весьма туманное, раз уж, в конце концов, вы прямо сейчас страдаете от блурита).
Давайте рассмотрим имеющуюся информацию:
• Базовый показатель для болезни с размытым зрением составляет один шанс из 10 000, или 0,0001.
• Использование хлорогидроксилена дает побочные эффекты в 5 % случаев, или 0,05.
Вероятно, вы решите: раз результаты анализов положительные, значит, вы больны. Но анализы несовершенны, поэтому утверждение так не работает. И теперь, уже кое-что зная о мышлении Байеса, вы решите уточнить вопрос: «Какова вероятность того, что у меня на самом деле заболевание, учитывая, что анализы положительные?» Не забудьте, что основные показатели свидетельствуют: шансы заболеть у произвольно выбранного человека – 0,0001. Но вы же не произвольно выбранный. Врач направил вас сдавать анализы.