Как-то раз я слышал репортаж о министре финансов некоей страны, который, судя по его цитируемой фразе, надеялся, что наступит день, когда все рабочие в его стране начнут зарабатывать больше, чем в среднем по стране (иногда автором этой «мудрости» называют Билла Клинтона). Должен признать, это блестящая идея. Можем только пожелать этому казначею долгих лет жизни – она ему понадобится, если он намерен дождаться дня исполнения своей мечты. В ответ на этот рассказ один из читателей предположил, будто казначей не в курсе, что такое средняя величина, и любезно объяснил: «50 % работников зарабатывают больше среднего, а 50 % – меньше». Само собой, он тоже не особенно разбирался в статистике – и спутал среднюю величину с медианой.
В другой раз я читал статью, автор которой, журналист, в статистике вроде как должен был разбираться по долгу службы. Он утверждал, будто каждый считает, что водит «лучше среднего», и объяснял, что такая ситуация математически невозможна. Он был неправ. И объяснить почему – очень просто. Скажем, пусть четверо из пяти водителей за последний год попали в аварию по разу, а пятый – 16 раз. Выходит, в общем все пятеро водителей попадали в аварии 20 раз, и средняя величина аварий на каждого водителя – 4. Получается, четверо из пяти (то есть 80 %) водят лучше среднего! В следующий раз, когда прочтете, что все считают себя водителями лучше среднего, не отвергайте это утверждение так быстро. Кто знает? Возможно, они правы – по крайней мере, статистически.
Один из самых странных и самых интересных фактов о статистике заключается в том, что многие люди, никогда ее не изучавшие, верят в то, что они ее понимают (покажите мне человека, который никогда не изучал дифференциальные уравнения в частных производных или функциональный анализ – и тем не менее уверяет, будто знает эти дисциплины). Люди часто бросают в разговоре реплики вроде: «Числа говорят сами за себя». Это глупо. Я никогда не слышал, чтобы число 7 говорило за себя или вело задушевные беседы с числом 3. А вы?
В этом контексте я хотел бы упомянуть две из моих любимых книг. Первая – «Математик за газетой»[23]
, в которой Джон Аллен Паулос объясняет, почему он (математик) читает новостные сводки совершенно иначе, нежели среднестатистический (медианный) человек. Вторая – чудесная книга Даррела Хафа «Как лгать при помощи статистики» [24]. Я часто обращаюсь к ней, когда начинаю проводить уроки по статистике: она помогает студентам не так сильно ненавидеть предмет.11. Вопреки всему
На первый взгляд кажется, что концепция «шансов», или «вероятностей», довольно проста. Мы и впрямь довольно часто говорим что-нибудь вроде: «Завтра, вероятно, будет снег», «Шанс на то, что я займусь спортом в ближайшие 45 лет, весьма невелик», «Вероятность выкинуть шестерку при броске кубика – один к шести», «Вероятность того, что будущим летом начнется война, только что удвоилась» или «После такого он, наверное, никогда не восстановится». И все же стоит только приступить к изучению концепции – и все оказывается намного более запутанным и сложным.
Начнем с простейшего примера: подбрасывания монеты. На вопрос о том, какова вероятность выпадения орла при броске монеты, любой, само собой, ответит, что орлы выпадут примерно в половине бросков. Возможно, это правильный ответ, но путаница возникает сразу же после того, как мы спросим: «Почему вы сказали “половина”? На каком знании основан этот ответ?»