Читаем Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха полностью

Как можно воспользоваться подобными данными обо всех американских налогоплательщиках, чтобы выяснить последствия жизни в том или ином районе? Наивный подход заключался бы в том, чтобы просто сравнить доход людей, выросших в разных местах. Но это привело бы нас к проблеме, которую мы уже обсуждали: корреляция не означает причинности.

Именно здесь в игру вступил ум – или, по мнению Фонда Макартуров, гений – Четти. Хитрость использованного его группой метода заключалась в том, чтобы сосредоточиться на конкретном и очень интересном подмножестве американцев – тех, которые в детстве переезжали. Поскольку весь набор данных был таким большим – помните, они рассматривали всех американских налогоплательщиков, – то и количество подобных людей было значительным.

Как же дети, переезжавшие в детстве, могут помочь установить причинно-следственные связи, относящиеся к проживанию в конкретном районе? Давайте подумаем, как это могло бы выглядеть.

Возьмем гипотетическую семью с двумя детьми, Сарой и Эмили Джонсон, и два города – Денвер и Лос-Анджелес. Предположим, что в нашем гипотетическом мире семья переехала из Лос-Анджелеса в Денвер, когда Саре было тринадцать лет, а Эмили восемь. Предположим далее, что Денвер лучше подходит для того, чтобы растить детей, чем Лос-Анджелес. Если дело обстоит именно так, мы должны ожидать, что Эмили достигнет в жизни больше, чем Сара, потому что проведет на пять лет больше в полезной для детей атмосфере Денвера.

Конечно, даже если Денвер в среднем действительно будет лучше подходить для того, чтобы растить детей, нет 100 %-ной гарантии, что Эмили с ее пятью дополнительными годами в Денвере покажет более высокие результаты в жизни. Возможно, у Сары есть какие-то преимущества, которые перевешивают меньшее количество лет, проведенных в Денвере. Возможно, Сара была более умной и превзошла сестру[80] благодаря интеллекту.

Если рассматривать десятки тысяч переехавших – что возможно, располагая данными обо всех американских налогоплательщиках, – то разница в способностях потомства будет взаимно компенсироваться. В определенном смысле всякий раз, когда семья минимум с двумя детьми переезжает из одной местности в другую, они производят тест двух районов. Если местность, откуда они уехали, лучше подходила для воспитания детей, можно ожидать, что старший ребенок окажется успешнее, потому что провел там больше времени. Если же более подходящей была та местность, куда они переместились, то можно ожидать больших успехов от младшего, потому что там он провел больше времени. Повторюсь, это будет верно не всякий раз.

Но если в вашей выборке достаточно переехавших и некоторые районы действительно лучше с точки зрения воспитания ребенка, вы должны будете увидеть систематическую разницу в результатах старших и младших, если семья уехала из этого района или приехала в него.

Кроме того, поскольку у детей одни и те же родители и, как можно ожидать, одинаковые генетически обусловленные способности, мы можем быть уверены, что стойкие отличия в результатах старших и младших обусловлены именно местностью. Умножьте это соображение на весь массив данных об американских налогоплательщиках, прибавьте кое-какую остроумную математику – и получите меру ценности всех жилых районов в Соединенных Штатах.

Итак, что же выяснили ученые? Давайте начнем с их анализа мегаполисов. Некоторые из них устойчиво дают детям преимущество. Если ребенок переезжает в правильную местность, он с меньшей вероятностью оказывается в тюрьме. Он получает более качественное образование. Он зарабатывает больше денег. Четти и его соавторы выяснили, что детство, проведенное в лучших городах (давайте назовем их супермегаполисами), может повысить доход во взрослой жизни приблизительно на 12 %[81].

Вот пять лучших мегаполисов, дающих наибольший прирост шансов ребенку в среднем:



Источник: Equality of Opportunity Project


Итак, со стороны родителя может быть мудро рассмотреть некоторые из этих мегаполисов в качестве подходящих мест для воспитания детей. Однако родители выбирают не только мегаполис, но и район внутри него.

Работа Четти и его сотрудников не ограничивается указанием, насколько хорош тот или иной мегаполис. В рамках каждого из них определенные районы дают лучшие результаты, а другие – наоборот. А некоторые районы могут оказаться выгоднее только для отдельных групп.

В своей замечательной статье Четти и его соавторы при помощи налоговых данных определяют, насколько годится каждый конкретный, даже самый маленький, жилой район в Соединенных Штатах, чтобы растить там мальчика или девочку, детей разных рас, детей с разным социально-экономическим статусом. Между мегаполисами существуют огромные различия, и некоторые из них дают выросшим там детям весьма значительное преимущество.

Перейти на страницу:

Все книги серии Библиотека ИТ. Главные книги о современных технологиях

Основы информационных технологий для неспециалистов: что происходит внутри машин
Основы информационных технологий для неспециалистов: что происходит внутри машин

Все, что вам нужно знать о компьютерах, интернете, приватности и безопасности.Компьютеры окружают нас повсюду, включая бытовую технику, автомобили, медицинское оборудование, транспортные системы, электросети и оружие. Однако большинство из них остаются невидимыми, собирая и иногда сливая наши личные данные. Это делает нас уязвимыми для правительств, компаний и преступников, которые могут использовать информацию в своих целях.«Основы информационных технологий для неспециалистов: что происходит внутри машин» известного ученого Брайана Кернигана рассматривает принципы работы компьютерного оборудования, программного обеспечения и сетей. Технологические изменения – это не отдельное событие, а непрерывный процесс – быстрый, постоянный и ускоряющийся. К счастью, основы работы цифровых систем останутся неизменными. Когда вы их поймете, то сможете лучше справляться с вызовами и возможностями, которые они предоставят.Вы узнаете:Как работают компьютеры, программное обеспечение и сети.Почему безопасность и конфиденциальность данных под угрозой.Как меняют нашу жизнь современные технологии.Для чего нужны big data и машинное обучение.Что происходит внутри компьютеров.Брайан Керниган – профессор факультета компьютерных наук Принстонского университета, член Национальной инженерной академии США, автор классического учебника «Язык программирования С», книг «Практика программирования», «UNIX. Программное окружение» и др.В формате PDF A4 сохранен издательский макет книги.

Брайан Керниган

Зарубежная компьютерная, околокомпьютерная литература

Похожие книги

Сетевые средства Linux
Сетевые средства Linux

В этой книге описаны принципы действия и область применения многих серверов, выполняющихся в системе Linux. Здесь рассматриваются DHCP-сервер, серверы Samba и NFS, серверы печати, NTP-сервер, средства удаленной регистрации и система X Window. He забыты и средства, традиционно используемые для обеспечения работы Internet-служб: серверы DNS, SMTP, HTTP и FTP. Большое внимание уделено вопросам безопасности сети. В данной книге нашли отражения также средства удаленного администрирования — инструменты Linuxconf, Webmin и SWAT.Данная книга несомненно окажется полезной как начинающим, так и опытным системным администраторам.Отзывы о книге Сетевые средства LinuxПоявилась прекрасная книга по Linux, осталось воспользоваться ею. Не упустите свой шанс.Александр Стенцин, Help Net Security. Если вы стремитесь в полной мере использовать сетевые возможности Linux — эта книга для вас. Я настоятельно рекомендую прочитать ее.Майкл Дж. Джордан, Linux OnlineВыхода подобной книги давно ожидали читатели. Менее чем на 700 страницах автор смог изложить суть самых различных вопросов, связанных с работой Linux. Автор является высококвалифицированным специалистом в своей области и щедро делится своими знаниями с читателями.Роджер Бертон, West, DiverseBooks.com

Родерик В. Смит

ОС и Сети, интернет / ОС и Сети / Книги по IT