Многие читатели посчитали его аргументы алармистскими – статья была написана в нарочито вызывающем духе, и казалось, что автор специально провоцирует публику на споры. На самом деле Андерсон даже приуменьшил серьезность ситуации. Объем информации, произведенной в одном только 2001 году, вдвое превзошел совокупность информации, произведенной за всю историю человечества. В 2002 году этот объем снова удвоился, и такая тенденция оставалась стабильной все последующие годы. Как отметил Андерсон, исследователи практически во всех областях владеют таким объемом информации, что становится трудно находить взаимосвязи между разными явлениями или делать прогнозы. В мире больших данных не работают выверенные ньютоновские законы причинно-следственных связей – скорее он тяготеет к обескураживающей путанице теории хаоса, в которой все связано со всем и самые незначительные изменения могут привести к масштабным последствиям. Или, точнее, мир был таким всегда, но мы этого до сих пор не замечали в силу ограниченности нашего восприятия. Только теперь мы получили возможность хоть одним глазком заглянуть в эту головокружительную бездну.
Андерсон смотрит на подобное развитие событий без фатализма; в своей статье он просто призывает пересмотреть общепринятый подход. Такие компании, как Google, обнаружили: если вы располагаете данными подобного масштаба, теория в принципе больше не нужна. Вы просто скармливаете числа алгоритмам и позволяете им делать прогнозы на основе закономерностей и взаимосвязей, которые им удается обнаружить. Гугл-поисковик умеет определять неправильно написанные слова и предлагать исправления, хотя ни с какой теорией языка не знаком. Он просто научился замечать, какие исправления «работают», анализируя гигантский массив данных – реальные поисковые запросы. Гугл-переводчик «научился» переводить с английского на французский, обрабатывая канадские документы, написанные на обоих языках, – хотя алгоритм не «понимает» ни тот язык, ни другой. Питер Норвиг, глава отдела исследований в Google, как-то похвастался, что ни один из людей, разрабатывавших переводчик с китайского, не говорит по-китайски.
Для Андерсона это было доказательством того, что такие математические инструменты могут предсказывать и понимать мир более адекватно, чем любая теория. «В мире петабайта мы можем позволить себе сказать: достаточно одной корреляции, – пишет он. – Нам больше не нужно строить модели. Мы можем анализировать данные, не выдвигая гипотез о том, какие выводы из этих данных можно сделать. Мы можем закинуть цифры в самые гигантские компьютерные кластеры, которые когда-либо видел мир, и статистические алгоритмы найдут закономерности там, где наука не может их обнаружить». Конечно, сами по себе данные способны объяснить,
В то время многие представители технологической индустрии посчитали этот вывод тревожным. Наука опирается на проверяемые гипотезы. Само по себе наличие корреляции между двумя явлениями ничего не объясняет, но и не считается достаточным, чтобы списать обнаруженную закономерность на простое совпадение. Задача ученого состоит в том, чтобы определить, какой механизм стоит за этой закономерностью, чтобы объяснить, почему она существует. Как отметил специалист по компьютерным технологиям Джарон Ланье в ответной статье, некоторые средства народной медицины работают, хотя никто не может объяснить почему. Но именно поэтому народная медицина не считается наукой. «Наука есть там, где есть понимание», – пишет он.