Обычные инструменты для работы с большими данными не очень хорошо действуют на этой территории. Способы статистических предсказаний, например оценка методом максимального правдоподобия, не подходят, потому что в мире зиллионики максимально правдоподобное значение становится невероятным. Чтобы справиться с зиллионами бит в реальном времени, потребуются совершенно новые области математики, полностью новые категории программных алгоритмов и радикально инновационная аппаратная часть. Какие широкие возможности!
Нас ждут иная организация данных и величие зиллионики, и они обещают нам новую машину в масштабах всей планеты. Атомами этой гигантской машины будут биты. Из них можно создавать сложные структуры, как молекулы из атомов. Повышая уровень сложности, мы переносим биты из данных в информацию, а затем в знания. Настоящая сила данных в изобилии способов, с помощью которых их можно перераспределить, реструктурировать, повторно применить, по-новому увидеть, использовать в ремиксах. Биты хотят быть связанными: чем больше отношений у бита информации, тем больше власти он получает.
Но проблема здесь обусловлена тем, что основная часть информации, которую можно использовать, представлена только в тех формах, которые понимают люди. Фотография, снятая на телефон, содержит последовательность из 50 миллионов битов, организованных таким способом, который имеет смысл для человеческого взгляда. Книга, которую вы читаете, состоит где-то из 700 000 битов, упорядоченных в соответствии с грамматикой вашего языка. Но у нас есть ограничения. Люди не могут прикоснуться к зиллионам битов, не говоря уже о том, чтобы их обработать. Чтобы исследовать весь потенциал зиллионбайтов информации, которые мы собираем и создаем, нужно быть способными организовать биты так, чтобы машины и искусственный интеллект могли их понимать. Когда машины обработают данные, полученные в результате самоотслеживания, это обеспечит нам инновационные и улучшенные способы посмотреть на самих себя. Через несколько лет, когда искусственный интеллект сможет понимать кинофильмы, мы будем использовать зиллионбайты визуальной информации в совершенно новых целях. Искусственный разум разделит изображения на элементы так, как мы тексты, а значит, сможет с легкостью собирать их в новом порядке так, как мы составляем в новом порядке слова и фразы, когда пишем.
Абсолютно новые отрасли возникли за последние два десятилетия благодаря идее разделения. Музыкальную индустрию перевернули технологические стартапы, которые позволили вычленять мелодии из песен и песни из альбомов. Революционный магазин iTunes начал продавать отдельные песни, а не альбомы. Когда музыкальные элементы отфильтровали и извлекли, их стало возможно комбинировать в новых сочетаниях, таких как плей-листы, которыми можно поделиться. Крупные газеты общей направленности разделились на тематические: объявления (Craigslist), биржевые сводки (Yahoo!), сплетни (BuzzFeed), ресторанную критику (Yelp) и истории (интернет), которые стали развиваться самостоятельно. Эти новые элементы можно перераспределить в новые текстовые объединения, то есть сделать из них ремикс. Например, поток новостей, на которые ссылается в Twitter ваш друг. Следующий шаг – разделить тематические объявления, новости и истории на еще более элементарные частицы, которые можно будет перераспределить еще более неожиданными и невообразимыми способами.
Из этого расщепления информации на еще более мелкие подчастицы родится что-то вроде новой химии. В следующие 30 лет важнейшей задачей станет дробление всей информации, которую мы отслеживаем и создаем: о бизнесе, образовании, науке, спорте и социальных отношениях, – на первоначальные элементы. Для предприятия такого масштаба потребуется масса циклов распознавания. Специалисты по обработке данных называют это «машиночитаемой» информацией, потому что искусственные интеллекты, а не люди будут работать с зиллионами. Когда вы слышите, например, термин «большие данные», речь идет именно об этом.
Эта новая информационная химия даст тысячи новых соединений и строительных материалов. Бесконечное отслеживание неизбежно, но это только начало.
К 2020 году мы будем производить 54 миллиарда сенсоров в год{276}
. Распределенная по всему земному шару, встроенная в машины, облекающая наше тело, наблюдающая за нами дома и на работе сеть сенсоров в следующие десять лет породит еще 300 зиллионбайтов данных. Каждый из битов, в свою очередь, породит вдвое больше метабитов. Отслеженный, разъятый и обработанный утилитарными искусственными интеллектами огромный океан информационных атомов может быть облечен в сотни новых форм, товарных новинок и инновационных услуг. Новый уровень слежения создаст возможности, которые потрясут нас.Глава 11
Постановка вопросов
Борис Александрович Тураев , Борис Георгиевич Деревенский , Елена Качур , Мария Павловна Згурская , Энтони Холмс
Культурология / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / История / Детская познавательная и развивающая литература / Словари, справочники / Образование и наука / Словари и Энциклопедии