Читаем Математика с дурацкими рисунками. Идеи, которые формируют нашу реальность полностью

В статье «Автоматизированная гендерная классификация письменных текстов», опубликованной в 2001 году, три исследователя ухитрились добиться 80 % точности, отличая авторов-мужчин от авторов-женщин, просто за счет подсчета частотности употребления нескольких простых слов[208]. Более поздняя статья, озаглавленная «Пол, жанр и стиль письма в официальных письменных текстах», содержит изложение этого отличия в простых терминах[209]. Во-первых, мужчины используют больше определяющих слов при существительных (определенный и неопределенный артикль, «некоторый», «самый» и т. д.). Во-вторых, женщины используют больше местоимений («мне», «он сам», «наш», «они» и т. д.).



Даже частотность одного-единственного невинного слова «ты» дает ключ к пониманию пола автора:



Точность системы особенно впечатляет, если учесть ее абсолютную простоту. Этот подход игнорирует весь контекст, весь смысл, чтобы сосредоточиться на словесных щепках. Блатт отмечает, что в соответствии с этой методикой фраза «Эта фраза написана женщиной», скорее всего, будет классифицирована как написанная мужчиной. Если вы посмотрите шире и будете учитывать все слова, а не только крошечные вспомогательные, результаты станут стереотипными. Когда компания по сбору данных под названием CrowdFlower обучила алгоритм определять пол пользователей Твиттера, он выдал следующий перечень слов, позволяющих предсказать пол[210]:



В книге «Любимое слово Набокова — лиловый» Бен Блатт приводит свои изыскания по поводу маркеров пола автора в классической литературе:



Похоже, программа «Под волшебным соусом» тоже использует такого рода подсказки. Когда математик Кэти О’Нил опробовала этот алгоритм на текстах мужчин о моде, они определились как женские на 99 %. А тексты женщин о математике оказались якобы на 99 % мужскими. Три текста самой О’Нил оказались мужскими на 99 %, 94 % и 99 %. «Моя выборка мала, — пишет она, — но я готова поспорить: эта модель основана на том стереотипе, что можно определить пол автора по выбранной им теме»[211].

Несмотря на то что эти алгоритмы неточны, у меня по-прежнему холодок бежит по коже. Похоже, маскулинность настолько пронизала мои мысли, что алгоритм может выявить мой пол двумя независимыми путями: определив, насколько часто я использую те или иные местоимения или насколько нежно я привязан к Евклиду.

Я отдаю себе отчет, что в некотором роде все это оправдывает мнение Вирджинии Вулф[212]. Она видела, что мужчины и женщины живут в разных мирах, и верила: борьба за то, чтобы дать голос женщинам, должна начаться на всех уровнях, вплоть до построения фразы. Грубая статистика подтверждает эту точку зрения: женщины пишут иначе, чем мужчины, и выбирают другие темы. И все же я немного удручен. Если тексты Вирджинии Вулф свидетельствуют о ее женственности, то мне нравится думать, что это связано с ее мудростью и чувством юмора, а не с низкой плотностью определителей при существительных. Когда Вирджиния Вулф разграничивает мужскую и женскую прозу, возникает ощущение, что ты обратился к проверенному врачу. Когда то же самое проделывает алгоритм, кажется, что тебя обыскивают в аэропорту.

4. Дом, кирпичи и известь

«Записки федералиста», написанные в 1787 году, помогли задать американскую форму правления. Они полны политической мудрости, изощренной аргументации и неустаревающих афоризмов («зрелище смут и раздоров» — вы оценили?). Это могло бы стать убойной строчкой в резюме, но есть одна загвоздка.

Авторы не подписали свои имена.

Историки смогли установить, что 43 письма написаны Александром Гамильтоном, 14 — Джеймсом Мэдисоном, пять — Джоном Джеем и еще три письма написаны в соавторстве. Однако оставалось тайной, кто авторы еще 12 писем. Гамильтон или Мэдисон? Даже два века спустя головоломка не была разгадана.

Наступили 1960-е годы, и на сцене появились два специалиста по статистике: Фредерик Мостеллер и Дэвид Уоллес[213]. Фред и Дейв осознали всю тонкость проблемы. Предложения, написанные Гамильтоном, состояли в среднем из 34,55 слов; написанные Мэдисоном — в среднем из 34,59 слов. «По некоторым параметрам, — пишут исследователи, — авторы почти что близнецы». И дальше они сделали шаг, который совершают все специалисты по статистике, когда сталкиваются с изощренной проблемой.

Они порезали «Записки федералиста» на мелкие куски[214].

Контекст? Неважен. Смысл? Уничтожен. Пока «Записки» оставались набором текстов отцов-основателей, они были бесполезны. Они должны были стать клочками бумаги, совокупностью тенденций — иными словами, набором данных.

Даже после этого большинство слов оставались бесполезными. Их частотность зависела не от автора, а от темы. Например, «война». «Когда речь шла о вооруженных силах, частота предсказуемым образом была высокой, — пишут Фред и Дэйв. — Когда речь шла о выборах — низкой». Они присвоили таким словам статус «контекстуальные» и предприняли все усилия, чтобы избавиться от них. Они были слишком осмысленными.



Перейти на страницу:

Все книги серии Библиотека фонда «Эволюция»

Происхождение жизни. От туманности до клетки
Происхождение жизни. От туманности до клетки

Поражаясь красоте и многообразию окружающего мира, люди на протяжении веков гадали: как он появился? Каким образом сформировались планеты, на одной из которых зародилась жизнь? Почему земная жизнь основана на углероде и использует четыре типа звеньев в ДНК? Где во Вселенной стоит искать другие формы жизни, и чем они могут отличаться от нас? В этой книге собраны самые свежие ответы науки на эти вопросы. И хотя на переднем крае науки не всегда есть простые пути, автор честно постарался сделать все возможное, чтобы книга была понятна читателям, далеким от биологии. Он логично и четко формулирует свои идеи и с увлечением рассказывает о том, каким образом из космической пыли и метеоритов через горячие источники у подножия вулканов возникла живая клетка, чтобы заселить и преобразить всю планету.

Михаил Александрович Никитин

Научная литература
Ни кошелька, ни жизни. Нетрадиционная медицина под следствием
Ни кошелька, ни жизни. Нетрадиционная медицина под следствием

"Ни кошелька, ни жизни" Саймона Сингха и Эдзарда Эрнста – правдивый, непредвзятый и увлекательный рассказ о нетрадиционной медицине. Основная часть книги посвящена четырем самым популярным ее направлениям – акупунктуре, гомеопатии, хиропрактике и траволечению, а в приложении кратко обсуждаются еще свыше тридцати. Авторы с самого начала разъясняют, что представляет собой научный подход и как с его помощью определяют истину, а затем, опираясь на результаты многочисленных научных исследований, страница за страницей приподнимают завесу тайны, скрывающую неутешительную правду о нетрадиционной медицине. Они разбираются, какие из ее методов действенны и безвредны, а какие бесполезны и опасны. Анализируя, почему во всем мире так широко распространены методы лечения, не доказавшие своей эффективности, они отвечают не только на вездесущий вопрос "Кто виноват?", но и на важнейший вопрос "Что делать?".

Саймон Сингх , Эрдзард Эрнст

Домоводство / Научпоп / Документальное
Введение в поведение. История наук о том, что движет животными и как их правильно понимать
Введение в поведение. История наук о том, что движет животными и как их правильно понимать

На протяжении всей своей истории человек учился понимать других живых существ. А коль скоро они не могут поведать о себе на доступном нам языке, остается один ориентир – их поведение. Книга научного журналиста Бориса Жукова – своего рода карта дорог, которыми человечество пыталось прийти к пониманию этого феномена. Следуя исторической канве, автор рассматривает различные теоретические подходы к изучению поведения, сложные взаимоотношения разных научных направлений между собой и со смежными дисциплинами (физиологией, психологией, теорией эволюции и т. д.), связь представлений о поведении с общенаучными и общемировоззренческими установками той или иной эпохи.Развитие науки представлено не как простое накопление знаний, но как «драма идей», сложный и часто парадоксальный процесс, где конечные выводы порой противоречат исходным постулатам, а замечательные открытия становятся почвой для новых заблуждений.

Борис Борисович Жуков

Зоология / Научная литература

Похожие книги

История леса
История леса

Лес часто воспринимают как символ природы, антипод цивилизации: где начинается лес, там заканчивается культура. Однако эта книга представляет читателю совсем иную картину. В любой стране мира, где растет лес, он играет в жизни людей огромную роль, однако отношение к нему может быть различным. В Германии связи между человеком и лесом традиционно очень сильны. Это отражается не только в облике лесов – ухоженных, послушных, пронизанных частой сетью дорожек и указателей. Не менее ярко явлена и обратная сторона – лесом пропитана вся немецкая культура. От знаменитой битвы в Тевтобургском лесу, через сказки и народные песни лес приходит в поэзию, музыку и театр, наполняя немецкий романтизм и вдохновляя экологические движения XX века. Поэтому, чтобы рассказать историю леса, немецкому автору нужно осмелиться объять необъятное и соединить несоединимое – экономику и поэзию, ботанику и политику, археологию и охрану природы.Именно таким путем и идет автор «Истории леса», палеоботаник, профессор Ганноверского университета Хансйорг Кюстер. Его книга рассказывает читателю историю не только леса, но и людей – их отношения к природе, их хозяйства и культуры.

Хансйорг Кюстер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Манхэттенская диета
Манхэттенская диета

Жители Манхэттена окружены разнообразными ресторанами, кофейнями, палатками с хот-догами и пр. И тем не менее стройность и привлекательность нью-йоркских женщин известна по всему миру. В этой книге Эйлин Даспин делится с читательницами секретом, как можно, не лишая себя сладкого, соленого и жирного, не изнуряя вечными тренировками, сбросить вес и сохранить красивую фигуру. Приводя в пример реальные истории из жизни нью-йоркских знаменитостей, автор объясняет, в чем заключается их талант так хорошо выглядеть.Эта книга поможет вам сбросить лишний вес раз и навсегда, улучшить состояние волос и кожи, а также получить удовольствие от чтения увлекательных историй из жизни манхэттенцев. Перевод: И. Шкурко

Эйлин Даспин

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Здоровье и красота / Дом и досуг
Что мы думаем о машинах, которые думают. Ведущие мировые ученые об искусственном интеллекте
Что мы думаем о машинах, которые думают. Ведущие мировые ученые об искусственном интеллекте

«Что вы думаете о машинах, которые думают?» На этот вопрос — и на другие вопросы, вытекающие из него, — отвечают ученые и популяризаторы науки, инженеры и философы, писатели-фантасты и прочие люди искусства — без малого две сотни интеллектуалов. Российскому читателю многие из них хорошо известны: Стивен Пинкер, Лоуренс Краусс, Фрэнк Вильчек, Роберт Сапольски, Мартин Рис, Шон Кэрролл, Ник Бостром, Мартин Селигман, Майкл Шермер, Дэниел Деннет, Марио Ливио, Дэниел Эверетт, Джон Маркофф, Эрик Тополь, Сэт Ллойд, Фримен Дайсон, Карло Ровелли… Их взгляды на предмет порой радикально различаются, кто-то считает искусственный интеллект благом, кто-то — злом, кто-то — нашим неизбежным будущим, кто-то — вздором, а кто-то — уже существующей реальностью. Такое многообразие мнений поможет читателю составить целостное и всестороннее представление о проблеме.

Джон Брокман , Коллектив авторов

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Природа и власть
Природа и власть

Взаимоотношения человека и природы не так давно стали темой исследований профессиональных историков. Для современного специалиста экологическая история (environmental history) ассоциируется прежде всего с американской наукой. Тем интереснее представить читателю книгу «Природа и власть» Йоахима Радкау, профессора Билефельдского университета, впервые изданную на немецком языке в 2000 г. Это первая попытка немецкоговорящего автора интерпретировать всемирную историю окружающей среды. Й. Радкау в своей книге путешествует по самым разным эпохам и ландшафтам – от «водных республик» Венеции и Голландии до рисоводческих террас Китая и Бали, встречается с самыми разными фигурами – от первобытных охотников до современных специалистов по помощи странам третьего мира. Красной нитью через всю книгу проходит мысль, что вопрос окружающей среды – это всегда вопрос власти. Смысловым центром книги является раздел «Вода, лес и власть». Не менее важна мысль, что «природа» – не только что-то внешнее по отношению к человеку, но и значительная часть его самого. История экологии, по мнению автора, – это история менталитетов. Особая ценность книги состоит в гигантском охвате использованной литературы – проанализированы не только ведущие труды известных зарубежных специалистов XX века, но и реакция на них.Книга адресована широкому кругу читателей.

Йоахим Радкау

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература