После террористических атак 11 сентября 2001 г. жители Нью-Йорка были поражены совпадением случайных «фактов», возникших вокруг злодеяния. Например, номер рейса первого самолета, который врезался во Всемирный торговый центр, – 11! В сочетании «Нью-Йорк Сити» 11 букв, равно как и в английском написании слова «Афганистан» (Afghanistan), и в имени президента Буша (George W. Bush). Кроме того, 11 сентября – это 254-й день года. «И что?» – спросите вы. Как что? 2 + 5 + 4 = 11! Даже форма башен-близнецов напоминает число 11. Вот теперь и правда становится страшно!
Еще одна интересная проблема, косвенно с этим связанная, – раскрытие преступлений по отпечаткам пальцев. Я выступаю в защиту такого мнения: когда суды готовятся предъявить кому-либо обвинение, поскольку его отпечатки пальцев совпали с теми, что нашлись на месте преступления, сперва неплохо бы подумать о том, сколь густо населена округа. Насколько мне известно, совпадения по отпечаткам пальцев никогда не бывают идеальными: совпадает лишь определенное количество идентичных форм. (Возможно, вы помните, как сказал Бенджамин Франклин: уверенным быть можно в двух вещах – в налогах и в смерти. Об отпечатках пальцев он не упоминал.) Вероятность того, что совпадут неидентичные отпечатки, составляет 1:100 000 или 1:200 000, в зависимости от того, что за книгу вы держите в руках. Итак, если отпечатки найдены на месте преступления в поселке, где проживают двести человек, и у нас есть подозреваемый, чьи отпечатки совпадают с найденными на месте преступления, тогда шанс того, что мы нашли преступника, весьма высок: вряд ли мы найдем в этом городишке другого жителя с такими же пальчиками. Но, когда этот метод применяют к преступлению, совершенному, скажем, в Нью-Йорке или Токио, разумно предположить, что там мы можем найти гораздо больше людей со схожим паттерном отпечатков.
Хотя средние величины часто упоминаются в самых разных повседневных контекстах, мне кажется, что «среднее» – это одна из самых запутанных проблем в мире статистики. Например, нам скажут, что средняя месячная зарплата в условном Хэппиленде – стране счастливой жизни – составляет $100 000. Что это значит? Я спросил нескольких умных людей, и оказалось, что многие понимают это так: примерно у 50 % жителей Хэппиленда доход превышает $100 000, а у другой половины он ниже этой отметки. Конечно же это ошибка. Величина, разделяющая население надвое, – это не среднее, а
Со средней величиной есть проблема: она очень чувствительна к крайним значениям. Если наш менеджер удвоит даже только свою зарплату – и никто другой при этом не получит ни гроша, – средняя зарплата равно так же практически удвоится. Впрочем, медиана (не забывайте, что медиана – это «срединная» величина в перечне чисел, выстроенном от самого малого к самому большому) создает противоположную проблему. Такое же повышение зарплаты менеджера не окажет на медиану никакого влияния: она совершенно нечувствительна к крайним значениям. И если мы хотим показать ситуацию в численно обоснованном виде, то должны представить и медиану, и среднюю величину, а также стандартное отклонение и форму распределения. Любопытно: когда данные о зарплате появляются в новостях, почти всегда сообщают о «средней зарплате» или о «средних расходах среднестатистической семьи» (надеюсь, теперь вы понимаете причину). Безусловно, редакторы новостей чувствуют, что им не следует углубляться в статистические сложности: это разве что заставит зрителей переключить канал. Но вы, мои любезные читатели, не должны делать никаких умозаключений на основе этих данных. Ясно, что статистик, стоя одной ногой в ледяной воде, а другой – в кипятке, блаженствует (в среднем).