Что ж, с момента начала сноуденовских разоблачений минул месяц — и картина рисуется замечательная. С одной стороны, Европа продолжает накручивать сама себя и в последние дни дошла до организации полномасштабного расследования вскрывшейся слежки США за европейскими гражданами, а также предложений отказаться от пользования американскими интернет-ресурсами и даже прекращения, если понадобится, воздушного сообщения между США и ЕС. С другой, как выяснилось, следят за простыми людьми не только США, но и Франция, и Англия (совместно с АНБ тихо врезавшаяся в трансатлантический оптоволоконный бэкбон). А Германия и «большинство других западных стран» (по Сноудену) если и не имеют собственных систем слежки, то сотрудничают с АНБ ради получения информации из той самой базы данных, существование которой так разозлило их политиков.
Таким образом, разбор отдельных инцидентов теряет смысл: как и предполагалось, рыльце в пушку у всех. На первый план выходит аспект, месяц назад недооценённый. АНБ, ФБР, DGSE, MI-5 и MI-6, а с ними, вероятно, и другие спецслужбы интересуются прежде всего метаинформацией. Когда Сноуден только начинал публикацию секретных материалов, официальные лица в США, если помните, пытались смягчить
социальный резонанс, обращая внимание публики именно на тот факт, что часто речь идёт о сборе «всего лишь метаданных». Однако при ближайшем рассмотрении выясняется, что именно они наиболее ценны. Но что же это за данные такие?Википедия определяет метаданные как «информацию об информации». Попросту говоря, применительно к нашему случаю это любые косвенные сведения о состоявшемся контакте двух лиц: кем и с кем был установлен контакт, когда, где, сколько длился, какой была тема и тому подобное. Формально метакатегория дробится как минимум на структурную метаинформацию (описывающую строение данных) и описательную (собственно о данных). А при желании выделяются и более мелкие части. Но для нас сейчас важнее не теория, а практика: чем такие сведения могут быть полезны практически?
Лично мне памятны примеры Второй мировой войны, когда, пожалуй, впервые анализу метаинформации стали уделять такое же внимание, как и непосредственно информации о противнике. Знание времени, места отправления, автора шифрованных радиопередач позволяло предположить как минимум смысл и частичное содержание текста. А это, например, компенсировало жёсткую нехватку вычислительных мощностей при расшифровке сообщений, пропущенных через знаменитую Энигму (в замечательной «Книге кодов» Саймона Сингха история описывается в мельчайших деталях). И даже если вскрыть шифровку не удавалось, учёт метаинформации всё равно приносил пользу, раскрывая направление движения частей противника, схему их взаимодействия и т. п.
Сегодня, когда «жить громко» — нормальное и даже ожидаемое для среднестатистического индивида поведение, а сбор и обработка информации легки и дёшевы как никогда, игнорировать метаданные просто грех. Увидеть, какие вкусности извлекаются таким «непрямым» путём, можно, воспользовавшись веб-сервисом Immersion
, построенным сотрудниками MIT. Этот сервис работает в паре с Gmail: вы предоставляете доступ к своей переписке, Immersion собирает и анализирует метаинформацию о ваших письмах, не читая собственно текста, после чего генерирует наглядный социальный граф. Не имея понятия, о чём именно вы переписывались с вашими друзьями и знакомыми, Immersion легко рассортирует письма по важности для вас, найдёт пересечения ваших контактов и таким образом сделает видимыми сообщества, в которых вы (возможно, сами того не подозревая) участвуете. И в целом даст пищу для размышлений на тему того, с кем вы общаетесь, почему, каково качество этих связей, стоят ли они того, чтобы их активизировать, и прочее, и прочее.И это только электронная почта плюс рудиментарный метаанализ! АНБ же и другие спецслужбы можно представить в виде почтальона, подробно описывающего каждую проходящую через его руки посылку (а таковой может быть любая контент-единица, вплоть до отдельных IP-пакетов) и владеющего уникальным арсеналом средств для анализа собранных сведений. Кроме того, спецслужбы имеют доступ к материалам, которые простому человеку никогда доступны не будут, — вроде информации о тех же телефонных звонках. Собрав гигантскую базу данных из разнородных метаединиц, можно искать в ней зависимости (скажем, в виде пересекающихся социальных графов), строить цепочки, выявлять шаблоны. После чего применять против интересующих субъектов более грубые методы вроде слежки, прослушки и пр.