Но если речь идет о производстве программного обеспечения, которое распространяется онлайн, то здесь цена ошибки может быть меньше, чем стоимость предварительных исследований, а в таком случае проверка «в полях» работает максимально эффективно.
Как мы обсуждали ранее, в лабораторных условиях пользователи ведут себя неестественно и выборки респондентов не всегда репрезентативны. Так что именно релиз в формате smoke-test[54] на репрезентативную долю пользователей может дать статистически достоверный ответ.
Чтобы минимизировать негативный эффект, новую функциональность следует открывать на ограниченное количество пользователей – специальную группу лояльных пользователей, которых называют бета-тестерами.
Термин подразумевает, что существует еще альфа-тестирование – тестирование членами команды разработки (quality assurance engineer[55]) на этапе проверки ПО в отношении соответствия условиям приемки. Как правило, для бета-тестирования выбирают очень лояльных пользователей, чтобы минимизировать негативные отзывы о возможных проблемах. Иногда, в случае дорогих продуктов, например игр, бета-версии раздаются специально для генерации обзоров и формирования положительного образа продукта.
В магазине приложений Google Play Market предусмотрен специальный режим обновления продукта, при котором бета-тестеры из списка получают более актуальное ПО быстрее остальных пользователей.
«Проверке боем» близки по духу раскрытие на белый список или раскрытие на долю.
В белый список, в противоположность черному, входят пользователи, максимально релевантные исследованию. Это может быть минимальная репрезентативная выборка, из которой иногда исключаются какие-то клиентские сегменты, территории или модели устройств.
Как правило, раскрытие на белый список происходит при помощи механизма feature-toggling – «выключателя фич», когда те или иные фичи в реальном времени можно включить или выключить с сервера.
Например, в банковских мобильных приложениях часто из числа первопроходцев исключают VIP-клиентов или людей с нестабильными дешевыми смартфонами.
Раскрытие на долю применяется, когда есть вероятность потенциальной перегрузки серверной части ПО, обвала контакт-центра или какого-либо другого сервиса, в основе которого работают люди.
В Google Play Market предусмотрены специальные варианты обновления, позволяющие раскрыться на 10, 20, 50 % аудитории. В таких случаях также может использоваться механизм feature-toggling, чтобы не только гибко открывать, но и закрывать функциональность, если эксперимент окажется неудачным. Есть способ настроить автоматическое отключение (Automatic Rollback) при достижении определенных критериев производительности, таких как доля случаев экстренного завершения работы приложения, нагрузка на сервер, среднее время ожидания на выделенной телефонной линии и т. п.
A/B-тестирование – частный случай мультивариантного тестирования (MVT), описанного ранее. По сути, это аналог бета-тестирования или раскрытия на белый список, но на пользователей открываются два варианта реализации функциональности: вариант А и вариант Б. Сравнив бизнес-показатели двух вариантов, можно выделить более эффективный и раскрыть его на всех пользователей.
Работая над дизайном «Альфа-Мобайл», мы пришли к тому, что на первом экране появилось много элементов меню первого уровня и пользователям было трудно найти нужное. По этой и по ряду других причин мы решили переделать навигацию по приложению. Мнения в команде разделились. Я предлагал использовать панель вкладок (tab bar, таб-бар) – нижний навигационный элемент, стандартный в iOS и в тот момент легализованный в Google Material Design. Главный дизайнер приложения предлагал вариант с центральной разделяющей кнопкой; ближайший аналог подобного решения – интерфейс Spotify.
В определенный момент для некоторой доли пользователей Android были открыты два варианта навигационного элемента
Моим аргументом было то, что панель вкладок – привычный элемент. Аргумент главного дизайнера – что новый элемент придает уникальности приложению.
Я провел эвристический анализ с использованием в том числе материалов Nielsen Norman Group, эта компания известна своими многочисленными исследованиями в области дизайна интерфейсов, многие выводы из которых, включая «эвристики Nielsen»{6}, активно используют UX-исследователи для эвристического анализа интерфейсов. В результате я не выявил значительных различий.
Следующим шагом стало проведение юзабилити-исследования, в нем показатели таб-бара были немного лучше, но разница оказалась меньше погрешности. Несмотря на то что мы получили огромное количество информации об опыте пользователей, мы не смогли достичь статистически значимого результата.