Какая из реплик звучит естественнее? Вот именно. Вторая. Обратите внимание на то, насколько иной стала интонация при совсем незначительных изменениях текста. Во втором варианте вместо восклицательного знака – междометие «хм» и точка в конце предложения, – и в реплике теперь легко читается мрачная ирония. Мы уже замечали, что восклицательные знаки реже встречаются в бестселлерах, а на этом примере видно, насколько богаче нюансами становится тон, если фраза не завершается оглушительным восклицанием. Точки, кстати говоря, тоже гораздо чаще встречаются в бестселлерах по сравнению с обычными книгами, а вот двоеточие и точка с запятой – значительно реже.
Эти характеристики мельчайших деталей индивидуального стиля автора, возможно, не слишком информативны, если брать каждую по отдельности. Однако вместе взятые они показывают важные закономерности в передаче авторского голоса и интонации, характерные для бестселлеров. Решение автора написать
Мужчины и женщины
На основании всех этих параметров (чаще всего незамечаемых), бестселлерометр вывел формулу идеального стиля. Когда мы взяли весь свой корпус бестселлеров и выстроили их исключительно по стилю, к нашему удивлению, оказалось, что во главе списка – почти одни женщины. Когда мы ранжировали книги по тематике и сюжету, картина была иная. Произведений авторов-мужчин в нашей коллекции бестселлеров было намного больше – почти на сотню. Но когда дело дошло до владения стилем, наиболее типичным для бестселлеров, женщины явно одержали верх. Более того, книги, которые наша модель отметила как лучшие по стилю, не обязательно принадлежали известным писателям. Многие из этих женщин попали в списки бестселлеров с первой же книгой. Мы взяли десять дебютных книг, занимающих самые высокие места в списке, – и оказалось, что девять из них написаны женщинами. Мы были крайне удивлены таким гендерным однообразием. Неужели авторам-женщинам легче попасть в список бестселлеров? Может, у них врожденное чутье на «гены» стиля, который способствует популярности?
Эти вопросы повели нас совершенно по иному пути, заставив отойти от намеченного ранее. Компьютерный анализ книг вообще часто преподносит сюрпризы, и в этом его прелесть. С этим сюрпризом мы решили разобраться. Мы хотели выяснить, насколько сильно выражен гендер в тексте. Предшествующие исследования в области установления пола автора с помощью компьютерного анализа достигли точности 83 %. Интересно, подумали мы, даст ли наша модель похожий результат?[159]
Сможет ли система в самом деле определить пол автора, глядя всего лишь на способ употребления слова