Читаем Невидимые женщины. Почему мы живем в мире, удобном только для мужчин. Неравноправие, основанное на данных полностью

Разумеется, виной всему вовсе не особенности женской речи. Виноват наш старый друг, дефицит гендерных данных. Голосовые технологии создаются на основе баз данных аудиофайлов с записями речи, так называемых речевых корпусов. И в этих базах данных преобладают записи мужской речи, во всяком случае, насколько мы можем судить, ведь в большинстве речевых корпусов записи не разбиты по половому признаку, что само по себе уже является пробелом в данных[700]. Когда Рейчел Татман сравнила доли записей мужской и женской речи в речевых корпусах, оказалось, что только в TIMIT («главном и наиболее известном речевом корпусе Консорциума лингвистических данных») данные разбиты по половому признаку. При этом на долю записей мужской речи приходилось 69 % общего количества записей. Но, вопреки выводам Рейчел Татман, найти записи женских голосов можно: как указано на сайте Британского национального корпуса[701], эта база данных является гендерно сбалансированной[702]

.

Речевые корпуса – не единственные базы данных, используемые для разработки алгоритмов, страдающих от «мужского перекоса». Корпуса текстов (включающие самые разные тексты – от романов до газетных статей и стандартных учебников) используются при разработке программ для переводов, сканирования резюме соискателей при приеме на работу и поиска в сети. Они тоже страдают от нехватки гендерных данных. Прошерстив Британский национальный корпус[703] (100 млн слов из различных текстов конца XX в.), я обнаружила, что местоимения мужского рода всегда выскакивают в результатах поиска почти вдвое чаще местоимений женского рода[704]. При этом соотношение местоимений мужского и женского рода в Корпусе современного американского английского языка, содержащем 520 млн слов, также составляет 2:1, хотя он включает более современные тексты (вплоть до 2015 г.)[705]

. Алгоритмы, разрабатываемые на основе таких корпусов, страдающих от нехватки гендерных данных, создают впечатление, что в мире действительно преобладают мужчины.

Базы данных изображений тоже, судя по всему, страдают от нехватки гендерных данных. Проведенный в 2017 г. анализ двух наиболее часто используемых баз данных, содержащих «более 100 000 сложных изображений из интернета, снабженных описаниями», показывает, что количество изображений мужчин значительно превосходит количество изображений женщин[706]. Результаты исследований Вашингтонского университета также говорят о том, что женщины недостаточно представлены в Google Images. Этот недостаток касался представительниц 45 профессий, причем наиболее заметное расхождение с реальностью наблюдалось по генеральным директорам компаний. В то время как доля женщин в общей численности генеральных директоров компаний в США достигала 27 %, по результатам поиска в Google Images этот показатель составлял лишь 11 %[707]. Результаты поиска по запросу «author»

(«автор») также оказались далекими от реальности: всего 25 % женщин, хотя на самом деле доля писательниц в общем количестве литераторов в США равнялась 56 %. Исследование также показало, что мнимые диспропорции искажают представления о реальном соотношении количества мужчин и женщин в различных профессиях – по крайней мере, в краткосрочной перспективе. С внедрением алгоритмов искажение реальной картины, естественно, примет долгосрочный характер.

Мало того, что женщины представлены в базах данных недостаточно, – они представлены еще и неверно. Авторы статьи, опубликованной в 2017 г., проанализировали стандартные текстовые корпуса, и выяснилось, что женские имена и указывающие на принадлежность к женскому полу слова, такие как woman, girl («женщина», «девушка») и т. д.), чаще употреблялись в связи с семьей, чем с карьерой. С мужскими именами и словами, указывающими на принадлежность к мужскому полу, ситуация была прямо противоположной[708]. Проведенный в 2016 г. анализ популярной общедоступной базы данных, созданной на основе Google News, показал, что первое место в списке женских профессий занимала «профессия» домохозяйки (homemaker

), в то время как в отношении мужчин доминировало обозначение maestro («маэстро», «мэтр»)[709]. В десятку наиболее распространенных профессий, так или иначе связанных с половой принадлежностью, входили философы, социологи, капитаны, администраторы, архитекторы и няни – догадайтесь сами, какие из них ассоциировались с мужчинами, а какие – с женщинами. Вышеупомянутый анализ баз данных изображений 2017 г. также показал, что изображенные объекты и их действия указывали на «весьма серьезный “мужской перекос”»[710]. Один из исследователей, Марк Яцкер, описал будущее, в котором робот, обученный с помощью таких баз данных и потому точно не знающий, что делают на кухне мужчины и женщины, «предлагает мужчине пиво, а женщине – помощь в мытье посуды»[711].

Перейти на страницу:

Похожие книги

Управление жизненным циклом корпораций
Управление жизненным циклом корпораций

Любая организация переживает тот же жизненный цикл, что и человек: она рождается в муках, затем наступают детство, юность, зрелость. На самом деле люди начинают стареть с момента своего рождения. То же самое происходит и с организациями.Разница этих процессов только в том, что для человека сыворотку вечной молодости еще не придумали, а для компаний она существует. Этот секрет рыночной молодости и задора изобрел один из лучших бизнес-мыслителей современности Ицхак Адизес.Эта книга – «библия» метода Адизеса. Это единственная книга, в которой автор последовательно рассматривает все три основные составляющие части своей методологии. В ней вы найдете блестящие практические рекомендации по совершенствованию управления и ответы на вопросы: почему одни компании достигают колоссального, а также устойчивого расцвета, а другие стареют и умирают? какие проблемы на каком этапе развития нормальны, а какие аномальны? как быстро диагностировать и решить управленческие проблемы? какие четыре стиля лидерства необходимы для успешного сотрудничества и руководства организацией?Книга переведена на 30 языков.

Ицхак Калдерон Адизес

Деловая литература / Финансы и бизнес
Реклама
Реклама

Что делает рекламу эффективной? Вопрос, который стоит и перед практиками, и перед теоретиками, и перед студентами, вынесен во главу угла седьмого издания прославленной «Рекламы» У. Уэллса, С. Мориарти и Дж. Бернетта.Книга поможет разобраться в правилах планирования, создания и оценки рекламы в современных условиях. В ней рассматриваются все аспекты рекламного бизнеса, от объяснения роли рекламы в обществе до конкретных рекомендаций по ведению рекламных кампаний в различных отраслях, описания стратегий рекламы, анализа влияния рекламы на маркетинг, поведения потребителей, и многое другое. Вы познакомитесь с лучшими в мире рекламными кампаниями, узнаете об их целях и лежащих в их основе креативных идеях. Вы узнаете, как разрабатывались и реализовывались идеи, как принимались важные решения и с какими рисками сталкивались создатели лучших рекламных решений. Авторы изучили реальные документы, касающиеся планирования описанных в книге рекламных кампаний, разговаривали с людьми, занимавшимися их разработкой. Сделано это с одной целью: научить читателя тем принципам и практикам, что стоят за успешным продвижением.Книга будет безусловно полезна студентам вузов, слушателям программ МВА, а равно и рекламистам-практикам. «Реклама: принципы и практика» – это книга, которую следует прочитать, чтобы узнать все об эффективной рекламе.7-е издание.

Джон Бернетт , Дмитрий Сергеевич Зверев , Сандра Мориарти , Светлана Александровна , Уильям Уэллс

Фантастика / Прочий юмор / Деловая литература / Юмор / Фантастика: прочее