Чтобы связать конфиденциальную информацию с именами людей, совсем не нужна команда журналистов New York Times, изучающих журналы поиска и телефонные книги. Также не требуется ни случайного, ни преднамеренного разглашения сведений. По мере распространения баз данных и усложнения аналитических технологий становится все проще использовать Всемирный компьютер для добывания личной информации. За несколько месяцев до того, как компания AOL опубликовала свои журналы поиска, писатель Том Оуад показал, насколько просто стало извлечь личные данные из интернета. Оуад, который поддерживает сайт для пользователей компьютеров Macintosh, написал простой фрагмент программного кода, так называемый скрипт, для скачивания списков пожеланий, размещаемых клиентами сайта Amazon.com. Миллионы людей составляют такие списки на сайте интернет-магазина для перечисления продуктов, которые они планируют приобрести в будущем или желают получить в качестве подарка. Эти списки может просмотреть любой, и обычно они содержат имя владельца списка, а также город и штат, в котором он проживает.
Имея два пятилетних ПК и стандартное домашнее интернет-соединение, Оуад смог загрузить более четверти миллиона списков пожеланий за один день. «Теперь у меня есть информация о читательских предпочтениях 260 000 граждан США», – написал он позднее на своем сайте. В каждом списке был закодирован уникальный идентификационный номер клиента Amazon, что позволило Оуаду легко рассортировать списки по пользователям. В получившейся базе данных он произвел поиск по названиям книг и другим ключевым словам, в частности, по ряду спорных или политически значимых книг и авторов от «Бойни номер пять» Курта Воннегута до Корана, от правых воззрений Раша Лимбо[41]
до левых взглядов его коллеги Майкла Мура[42]. Зная имена и местонахождение владельцев списков, он через сервис для поиска людей Yahoo People Search определил адреса и телефоны многих из них. Затем с помощью Google Maps нанес на карту их адреса. В итоге получилась карта Соединенных Штатов, отображающая точное местоположение людей, интересующихся конкретными книгами и идеями. Он разместил на своем сайте карту с указанием адресов клиентов Amazon, которые выразили заинтересованность в книге «1984» Джорджа Оруэлла. А мог так же легко опубликовать карту, показывающую, где живут люди, которых интересуют книги о выращивании марихуаны или о том, как отдать ребенка на усыновление. «Раньше считалось, – заключает Оуад, – что для наблюдения за человеком или группой людей вы должны получить ордер. Сегодня становится все проще отслеживать идеи, которые затем можно соединить с конкретными людьми».Оуад потратил изрядное количество времени на организацию и проведение своего эксперимента. Ему пришлось написать собственный код для загрузки данных и вручную произвести поиск по базе данных. Однако то, что Оуад сделал вручную, можно более эффективно выполнить автоматически, используя алгоритмы интеллектуального анализа данных, которые позволяют извлекать информацию одновременно из многих различных сайтов. Одна из основных характеристик компьютерной сети – взаимосвязь разнообразных хранилищ информации. «Открытость» баз данных представляет собой основной источник мощи Всемирного компьютера. Однако это также позволяет легко обнаружить скрытые взаимосвязи между отдельными фрагментами данных. Проанализировав эти отношения, можно обнаружить на удивление обширный кладезь конфиденциальной информации о веб-пользователях.