Читаем Все лгут. Поисковики, Big Data и Интернет знают о вас всё полностью

Поиск двойников – это еще один пример использования детализации. Он фокусируется на небольшой группе людей, наиболее похожих на данного человека. И, как и любая детализация, результат получается тем точнее, чем больше данных у вас есть. Оказывается, двойники Ортиса{132} выдали совсем другой прогноз на будущее самого Ортиса. Среди них были Хорхе Посада и Джим Томе. Эти парни начинали свои карьеры немного медленно, а затем следовали удивительные всплески результативности. Около 30 лет они достигли уровня мирового класса, а затем, в первые годы после 30, потихоньку сдавали.

Тут-то Сильвер и предсказал, как сложится карьера Ортиса – на основании судеб его двойников. Он обнаружил, что те восстановили свои силы. В отношении поклонниц Симмонс, возможно, был бы прав. Но что касается двойников Ортиса, то здесь все иначе – они сдали, но затем вернулись.

Поиск двойника – лучшая методика, когда-либо использовавшаяся для прогноза результативности бейсболиста. Согласно ей, «Сокс» должны были потерпеть. Клуб действительно не стал рубить сплеча. И в 2010 году средняя результативность Ортиса выросла до 270. Он совершил 32 хоумрана и вошел в сборную Всех звезд. А затем входил в нее еще четыре года подряд.

В 2013 году, играя на своей традиционной позиции назначенного отбивающего, в возрасте 37 Ортис набрал 0,688 очка, а Бостон победил Сент-Луис в Мировой серии – 4:2.

Ортис был признан MVP (наиболее ценным игроком) Мировой серии[29].

Едва дочитав статью о подходе Нейта Сильвера к оценке результативности игрока, я сразу же начал думать о том, может ли и у меня тоже быть двойник.

Поиск такового является перспективным во многих областях, а не только в спорте. Мог бы я найти человека, разделяющего мои интересы? Может быть, если бы я нашел кого-то, больше всего похожего на меня, мы могли бы проводить время вместе. Может быть, он бы знал рестораны, которые могли бы мне понравиться. Возможно, он мог бы познакомить меня с тем, чего я не знаю, и я бы заинтересовался этим.

Поиск двойников возможен даже по особенностям личности. И, как и любая детализация, сходство будет тем сильнее, чем больше у вас данных. Предположим, я буду искать двойника в наборе данных десяти человек. Я мог бы найти кого-то, кто разделяет мой интерес к книгам. Предположим, я буду искать двойника в наборе данных тысяч людей. Я мог бы найти кого-то, кому, как и мне, нравятся популярные книги о здоровье. Но предположим, что я буду искать двойника в наборе данных сотен миллионов людей. Тогда я мог бы найти кого-то, кто действительно похож на меня.

Однажды я провел поиск двойника в социальных сетях. Используя весь массив профилей Twitter, я искал людей, имеющих больше всего общих интересов со мной.

Вы, конечно, можете многое рассказать о моих интересах на основании информации в моем аккаунте в Twitter. В целом, я подписан примерно на 250 человек, разделяющих мою страсть к спорту, политике, комедиям, науке и мрачным еврейским певцам.

Так есть ли кто-нибудь во Вселенной, так же, как и я, подписанный на все эти 250 аккаунтов, мой твиттер-близнец? Конечно, нет. Двойники не идентичны нам, они лишь похожи на нас. И нет никого, кто подписан хотя бы на те же 200 аккаунтов. Или даже на 150.

Однако в конце концов я нашел аккаунт, подписанный на 100 пользователей из моих 250 – это Country Music Radio Today. Да неужели? Оказывается, Country Music Radio Today – это бот (его уже нет), который подписался на 750 тысяч профилей «Твиттера» в надежде, что они ответят ему тем же.

У меня есть бывшая подруга, которая, как я подозреваю, получила бы удовольствие от такого результата. Однажды она сказала, что я больше похож на робота, чем на человека.

Но шутки в сторону! Тот факт, что моим двойником стал бот, позволяет сделать важный вывод. Чтобы поиск двойников оказался по-настоящему точным, следует стремиться не просто найти кого-то, любящего то же, что и вы. Нужно искать того, кто не любит то же, что не любите вы.

Мои интересы становятся очевидными не только на основании тех аккаунтов, на которые я подписываюсь, но и тех, которые я не выбираю. Я интересуюсь спортом, политикой, комедиями и наукой, а не едой, модой или театром. Мои подписки показывают, что мне нравится Берни Сандерс, но не Элизабет Уоррен[30], Сара Сильверман, но не Эми Шумер[31], «New Yorker» но не «Atlantic»[32], мои друзья – Ной, Эмили Сэндс и Джош Готтлиб, но не Сэм Ашер. (Извини, Сэм, но твои посты в Twitter – это скукота.)

Перейти на страницу:

Все книги серии IT - бестселлер

Похожие книги

Оптимизация BIOS. Полный справочник по всем параметрам BIOS и их настройкам
Оптимизация BIOS. Полный справочник по всем параметрам BIOS и их настройкам

Прочтя эту книгу, вы узнаете, что представляет собой BIOS, какие типы BIOS существуют, как получить доступ к BIOS и обновлять ее. Кроме того, в издании рассказано о неполадках в работе BIOS, которые приводят, например, к тому, что ваш компьютер не загружается, или к возникновению ошибок в BIOS. Что делать в этот случае? Как устранить проблему? В книге рассказывается об этом и даже приводится описание загрузки BIOS во флэш-память.Также вы научитесь использовать различные функции BIOS, узнаете, как оптимизировать их с целью улучшения производительности и надежности системы. Вы поймете, почему рекомендуемые установки являются оптимальными.После прочтения книги вы сможете оптимизировать BIOS не хуже профессионала!Книга предназначена для всех пользователей компьютера – как начинающих, которые хотят научиться правильно и грамотно настроить свою машину, используя возможности BIOS, так и профессионалов, для которых книга окажется полезным справочником по всему многообразию настроек BIOS. Перевод: А. Осипов

Адриан Вонг

Зарубежная компьютерная, околокомпьютерная литература / Программирование / Книги по IT