Оправдание Салли Кларк произвело эффект домино. Безупречная репутация Мидоу как практически незаменимого эксперта была сильно подорвана, и последовал пристрастный анализ его экспертных оценок на нескольких других судебных процессах. В результате из тюрем были освобождены еще несколько женщин, приговоренных к заключению на основании устрашающе вольного обращения Мидоу со статистикой. К моменту освобождения Салли провела за решеткой более трех лет; это дьявольское испытание сломило ее. Стив печально заметил, что “она никогда не оправится”. После освобождения она действительно так и не оправилась от горя, к которому присоединились и другие психические расстройства. Салли Кларк умерла в 2007 году от острой алкогольной интоксикации; жизнь ее была необратимо разбита отвратительной экспертизой и полным невежеством публики, не способной понять суть статистики.
Трагическая история Салли Кларк служит еще одним напоминанием о том, что числа имеют значение. Чрезвычайно важно понимать, что статистика в отрыве от контекста и сути обсуждаемой проблемы является прекрасной питательной средой для возникновения путаницы. Очень грустно думать о тех судебных решениях, которые были приняты на основании сомнительных статистических данных, или о невинных людях, осужденных из-за математического невежества. Даже превосходная наука может оказаться сопряженной с чудовищными заблуждениями; вспомним, например, анализ строения ДНК и, соответственно, открывшуюся возможность прочесть тот код, которым записано строение и функции нашего организма. Исключительная достоверность результатов анализа ДНК в качестве доказательств в судебных делах часто воспринимается любителями как нечто безукоризненное, абсолютное и не могущее дать сбоев. Тем не менее, хотя и невозможно отрицать, что результаты анализа на ДНК являются мощным инструментом доказательства вины преступника, сам этот метод нельзя полагать полностью безупречным, и ошибки здесь возможны, так же как они возможны и в применении других методов научного исследования.
Подобно тому, как в рассмотренном нами выше примере с анализом на ВИЧ-инфекцию, верность заключения, выведенного на основании анализа ДНК, зависит от априорной информации о рассматриваемом случае. Представим, например, что на месте преступления найден фрагмент ДНК. Такое происходит в среднем один раз на миллион случаев. Если подозреваемый находится под стражей и обнаруживается совпадение его ДНК с образцом ДНК с места преступления, то это можно считать почти неопровержимой уликой, попаданием “в яблочко”. Однако если для обнаружения преступника нам приходится прочесать огромную базу данных о ДНК 10 миллионов человек, то мы скорее всего отыщем с десяток таких “попаданий” – но это будут по большей части просто совпадения. Теорема Байеса требует, чтобы – для оценки вероятности виновности – были учтены не только результаты теста, но и частота положительных результатов и объема выборки, в которой брали образцы. Таким образом, информационная ценность данного отрезка ДНК зависит от источника этой ДНК: взяли ли ее у одного конкретного человека – или нашли в результате прочесывания базы данных. Без такой информации присяжные рискуют впасть в “ошибку прокурора”.
Надо еще раз повторить, что это не говорит об ограниченности самой технологии, а лишь напоминает о необходимости правильно интерпретировать данные. Нельзя отрицать, что применение ДНК-тестов произвело революцию в судопроизводстве, но легкомысленные интерпретации приводили и приводят к вынесению неправосудных приговоров, и надо следить за тем, чтобы избегать ловушек, связанных с неверным применением теории вероятностей. Вероятность того или иного события может выглядеть почти достоверной, однако интуитивная простота часто оказывается абсолютно иллюзорной. Для того чтобы правильно понимать, что именно говорят нам числа, требуются контекст и вдумчивый анализ, и иногда верный вывод, к которому приводят числовые данные, может не совпадать с нашим первым и поверхностным впечатлением.
Парадоксальная природа статистики заключается в том, что очевидные на первый взгляд причины и следствия могут ввести нас в заблуждение, даже если данные, как нам кажется, поддерживают принятую нами гипотезу. Мы интуитивно считаем, что числа говорят сами за себя, но часто забываем, что они подчас требуют интерпретации.
Глава 13
Просеивание сигнала