Это возвращает нас обратно к слову stunning
. Разработчики Word2vec обратили внимание на интересный вектор: тот, который говорит нам, как перейти от слова he («он») к слову she («она»). Можете считать его вектором феминизации. Применив его к слову he, получаете слово she. Что, если применить его к слову king («король»)? Вы получаете точку, которая, как и в случае с парком Dismal Harmony, не попадет в точности в то место, для которого у вас есть слово. Но ближайшее слово – queen («королева»), как в случае парка ближайшим городом был Морристаун. Queen относится к king, как she к he. Это хорошо работает и для других слов: феминизированная версия для слова actor («актер») – actress («актриса»), а для waiter («официант») – waitress («официантка»).
А что насчет слова stunning?
Представьте себе: вы получите gorgeous («пышный, великолепный»). Слово gorgeous относится к слову she так же, как stunning к he. Приложите этот вектор в другом направлении, попросив программу Word2vec маскулинизировать stunning, и получите spectacular («зрелищный»). Поскольку эти аналогии представляют собой только приблизительные числовые равенства, они не всегда симметричны: результатом обратной феминизации для spectacular действительно будет stunning, но при маскулинизации слова gorgeous получится magnificent («великолепный»).Что это означает? Что в математическом, универсальном и совершенно объективном смысле слово gorgeousness
(«великолепие») – это женская версия слова stunningness («поразительность, ошеломительность»)? Естественно, нет. Программа Word2vec не знает значений слов и не имеет возможности узнать. Все, что она знает, – это огромный набор английских текстов (преобразованные в массу чисел газеты и журналы, выходившие в течение десятилетий), на которых ее обучали. Когда англоговорящие люди хотят выразить stunningness в отношении женщины, у них есть статистически обнаруживаемая привычка употреблять слово gorgeous. Когда речь идет о мужчине, такой привычки нет. Та геометрия, которую вычленила программа Word2vec, на первый взгляд может показаться геометрией смыслов, однако на самом деле это геометрия нашей манеры говорить; отсюда мы можем многое узнать как о себе и своих гендерных предрассудках, так и о нашем языке.Баловаться с Word2vec – все равно что положить собрание сочинений англоязычного мира на кушетку психоаналитика и заглянуть в его безобразное бессознательное. Феминизированная версия слова swagger
(«чванство») – sassiness («дерзость»); слова obnoxious («несносный, противный») – bitchy («стервозный»); слова brilliant («блестящий») – fabulous («вымышленный, сказочный»); слова wise («мудрый») – motherly («материнский»). Женский вариант для слова goofball («дурачок, недотепа») – ditz («глупышка»), а второй предлагаемый вариант – вот честное слово! – perky blonde («бойкая блондинка»)[330]. Женский вариант для слова genius («гений») – minx («кокетка»). И тут снова несимметричность: мужской вариант от minx – scallywag («озорник, проказник»). Шаг в мужскую сторону от teacher («учитель») – headmaster («директор школы»). Шаг в мужскую сторону от имени Карен[331] – Стив[332].Если вы возьмете bagel
(«бейгл») и феминизируете его, то леди-бейгл – это muffin («маффин»). Hindu bagel («индийский бейгл») – то есть то, что вы получите, если возьмете вектор, переводящий слово Jewish («еврейский»)[333] в Hindu («индийский»), и примените его к слову bagel, – это vada pav («вада пав»), популярное в Мумбаи вегетарианское блюдо: булочка с двумя картофельными котлетками. Catholic bagel («католический бейгл») – это sandwich («сэндвич»); второй вариант – meatball sub (сэндвич с фрикадельками под соусом).Программа Word2vec знает и названия городов. Если вместо широты и долготы использовать ее концептуальный векторный анализ, то Окономовоком для Нью-Йорка будет вовсе не Морристаун, а Саратога-Спрингс. Понятия не имею почему.