Читаем Новые боги. Как онлайн-платформы манипулируют нашим выбором и что вернет нам свободу полностью

Для подобного анализа речи уже давно используется метод лингвистического исследования и подсчета слов (Linguistic Inquiry and Word Count, LIWC). Работает он так: сначала электронный текст вводится в специальную программу. Затем исследователь получает информацию о том, какие слова – и как часто – использовались. В то же время программа проводит подробное индексирование нескольких тысяч слов[323]. Это позволяет проанализировать количество негативных или позитивных слов. Подобное изучение вокабуляра, естественно, дает возможность строить гипотезы и в отношении переменных, затрагивающих психику человека. Еще в 2006 году группа исследователей под руководством Маттиаса Меля пришла к выводу

[324], что экстраверты более многословны (показатель raw word count). Это означает, что прогнозирование психологических характеристик возможно не только на основе смыслового содержания речи, но и на базе других языковых переменных.

Хотя подход LIWC открывает совершенно новые возможности для психоинформатиков, он все же имеет свои ограничения. В частности, LIWC исследует словарный запас человека только на уровне употребления отдельных слов. Акцент на отдельных словах не позволяет распознать такие аспекты речи, как ирония или сарказм. Кроме того, при анализе эмоциональности словарного запаса учитываются только те слова, которые ранее были внесены в каталог программного обеспечения. Эти недочеты удалось исправить при помощи нового метода Open Vocabulary Approach (OVA), или «подхода открытого словаря», в котором можно учитывать даже словосочетания. Кроме того, при использовании OVA нет необходимости задавать ключевые слова перед анализом. Как отмечают Маргарет Л. Керн и ее коллеги, «новый метод исследует доминирующие отличительные слова и фразы, используя открытый словарь, включающий эмодзи, опечатки и фразы»[325]

. Результаты подобного анализа речи во многом совпадают с тем, как люди сами оценивают свое словоупотребление (что логично).

Хотя от стремительного развития языкового анализа в психоинформатике порой захватывает дух, я убежден, что в будущем, если мы хотим получать с помощью текстового анализа значимые результаты, необходимо будет регулярно делать новые выборки и уточнять показатель нормы. В противном случае устаревший кодовый ключ можно будет применять к новому набору данных лишь с особой осторожностью. Я уже приводил пример эффекта Флинна, когда использование стандартов из прошлого портит диагностику IQ. Приведу еще один, чтобы проиллюстрировать проблему, которая может возникнуть при использовании устаревшего кодового ключа в интеллектуальном анализе текста. В работе Маргарет Л. Керн была установлена связь между использованием слова «покемон» в постах на фейсбуке и «добросовестностью»[326]. Люди, которые часто упоминали покемонов в своем профиле, описывали себя как менее добросовестных. Получается, менее сознательные люди тратят больше времени на охоту за покемонами? Интересно! Но что произойдет, когда игра Pokémon Go полностью устареет? После шумихи 2016 года в Германии уже давно никто не говорит об этой игре. Значит, информация о покемонах сегодня для меня как для психоинформатика бесполезна. Получается, анализ речи напрямую зависит от времени, в котором мы живем.

Кстати, эта проблема касается не только интеллектуального анализа текста, но и оценки лайков в фейсбуке. Какой толк от того, что я знаю о диагностической силе лайков под публикациями о покемонах, если про них все уже давно забыли? Также важно отметить, что в разных культурах обсуждаются разные темы. Политические системы тоже различаются во всем мире. Михалу Косински в его исследовании удалось относительно точно спрогнозировать политические предпочтения американцев, но в Германии это было бы гораздо сложнее, поскольку у нас не двухпартийная система, как я уже говорил. Кроме того, немецкому психоинформатику, вероятно, никак не пригодится кодовый ключ, полученный на основе цифровых следов пользователей из США.

До сих пор мы говорили только о психоинформатических оценках переменных смартфона и социальных сетей. А теперь давайте отправимся в Китай и узнаем, какую информацию уже сегодня с помощью цифровых технологий извлекают, наблюдая за поведением студентов в университетском кампусе.

Ежедневное принятие душа и академическая успеваемость в Китае

Пасмурно, но тепло. Я встречаю коллегу в кампусе Университета электронной науки и техники Китая (UESTC). Это престижный университет в Чэнду, где я работал несколько лет, так что мы давно знакомы и я в курсе, чем коллега занимается. Прежде всего его интересует, какую информацию можно извлечь при анализе цифровых следов человека.

Перейти на страницу:

Похожие книги