Читаем Роман с Data Science. Как монетизировать большие данные полностью

Я уже расписал основные плюсы и минусы алгоритмов тестирования. Более подробные советы можно найти в книге «Семь главных правил экспериментов на веб-сайтах» [84]. Хочу предупредить читателя: к сожалению, в интернете много советчиков-теоретиков (и даже целые школы), которые все очень усложняют. Но даже научные статьи порой изобилуют ошибками, особенно если не были опубликованы в научных журналах и не озвучивались на авторитетных научных конференциях. Что уж говорить про посты уважаемых блогеров. Я сторонник простоты и считаю, что в методиках тестирования и анализа можно разобраться самостоятельно. Просто начинать нужно с самого простого – с фишеровской статистики с p-значениями. Открою секрет – если ваш тест действительно значим и данных в выборках достаточно, то все три метода покажут статистическую значимость. А вот ошибки, с которыми я сталкивался:

• неверная конфигурация теста;

• плохой генератор частот;

• неверный статистический критерий;

• проблема подглядывания;

• отсутствие пост-анализа;

• принятие решения, когда нельзя отвергнуть нулевую гипотезу.

Неверная конфигурация теста – самая частая проблема. Допустим, вы придумали гипотезу, у вас есть метрика, вы написали техническое задание на проведение теста. Если это ML-модель, то вы заранее провели офлайн-тесты – все было хорошо. После реализации теста и выкладки его в рабочую систему его нужно обязательно проверить. Если это сайт, то прощелкать нужные ссылки, проверить, что обеим группам показываются нужные версии страниц. А теперь представим, что тест запущен и в нем есть ошибка. Прошел месяц, пора считать результаты. Наше сознание заставляет нас искать ошибки, если результаты получились плохими, и просто радоваться, если результаты положительные. Но если в тесте была ошибка, то много времени было потрачено впустую и тест придется перезапускать. У меня на практике такое было сплошь и рядом. В результате мы в Retail Rocket разработали целый бизнес-процесс по запуску тестов с инструкциями по проверке. Такие ошибки очень дорого обходятся.

Плохой генератор случайных чисел для разделения всех пользователей на тестовую и контрольную группы тоже может быть проблемой. Надежный способ обнаружения такой проблемы – A/A-тесты. Второй вариант – симуляция. Тогда вам нужно точно повторить код разработчиков, который назначает сегменты, и проверить его работу на старых логах пользователей, то есть произвести имитацию A/B-теста. С такими генераторами часто возникают проблемы, поэтому команда инженеров написала свой вариант и выложила его исходный код в сеть [85].

Неверный критерий тоже может дать свою погрешность. Я бы рекомендовал в целях проверки делать симуляционные тесты выбранного статистического критерия. Это можно делать как с помощью генераторов распределений, так и с помощью уже имеющихся логов действий пользователя (если есть). Например, сделав два случайных генератора с одинаковыми исходными данными, нужно убедиться, что статистический критерий не показывает значимость. Затем сделать небольшую разницу между генераторами и убедиться, что статистическая значимость появилась. Также рекомендую сделать анализ мощности – сколько данных нужно, чтобы этот критерий показал статистическую значимость на какой-то минимальной для вас важности. Например, вы готовы внедрить новое улучшение только в том случае, если оно улучшает метрику на 1 %. Тогда вы делаете два генератора с этой разностью и моделируете работу критерия, чтобы понять, сколько точек данных вам нужно, чтобы заметить эту разницу. Это и будет вашим минимальным объемом выборки данных.

Перейти на страницу:

Все книги серии IT для бизнеса

О криптовалюте просто. Биткоин, эфириум, блокчейн, децентрализация, майнинг, ICO & Co
О криптовалюте просто. Биткоин, эфириум, блокчейн, децентрализация, майнинг, ICO & Co

Эта книга – самый быстрый способ войти в мир криптовалют и начать ими пользоваться.Вы хоть раз спрашивали себя, что такое биткоин, криптовалюта или блокчейн? А децентрализация? Как вы думаете, кто выиграл от появления интернета? Люди, которые были подготовлены к нему и стали использовать его в личных или коммерческих целях до того, как подтянулись остальные.Новая технология «блокчейн» дает аналогичную возможность. Она играет сейчас такую же роль, какую играл интернет последние 20 лет. Главный вопрос, который каждый себе задает, это «c чего мне начать?»Джулиан Хосп, соучредитель компании TenX и один из ведущих мировых экспертов по криптовалютам, просто и доступно объясняет сложные термины и дает четкую инструкцию к действию: как пользоваться криптовалютами, соблюдая правила онлайн-безопасности.У Илона Маска уже есть книга Джулиана Хоспа. А у вас?

Джулиан Хосп

Деловая литература / Маркетинг, PR, реклама / Финансы и бизнес
Роман с Data Science. Как монетизировать большие данные
Роман с Data Science. Как монетизировать большие данные

Как выжать все из своих данных? Как принимать решения на основе данных? Как организовать анализ данных (data science) внутри компании? Кого нанять аналитиком? Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня? На эти и многие другие вопросы Роман Зыков знает ответ, потому что занимается анализом данных почти двадцать лет. В послужном списке Романа – создание с нуля собственной компании с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru.Эта книга предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и набрать команду. А начинающим специалистам книга поможет расширить кругозор и начать применять практики, о которых они раньше не задумывались, и это выделит их среди профессионалов такой непростой и изменчивой области. Книга не содержит примеров программного кода, в ней почти нет математики.В формате PDF A4 сохранен издательский макет.

Роман Зыков

Карьера, кадры / Прочая компьютерная литература / Книги по IT
ChatGPT. Мастер подсказок, или Как создавать сильные промты для нейросети
ChatGPT. Мастер подсказок, или Как создавать сильные промты для нейросети

Уже сейчас нейросети выполняют тысячи контент-задач в разных сферах. От слоганов, статей и постов до учебных программ, выступлений и подбора креативных идей. Умение грамотно «общаться» с ИИ все чаще становится серьезным и порой даже главным карьерным или личным бонусом.Именно развитию навыков работы с ChatGPT и другими контентными ИИ (промт-инжиниринг) и посвящена эта книга. В ней даны правила и «фишки», показаны схемы и неочевидные моменты, которые должен знать сильный промтер. Также добавлены пошаговые мастер-классы создания промтов (подсказок) на основе некоторых маркетинговых и информационных типов контента.Книга написана сотрудниками проекта «Панда-копирайтинг», в рамках которого был создан ИИ-сервис NeuroPanda.app. Петр Панда – автор 7 книг в РФ и Европе по копирайтингу. Арина Сычева – старший куратор NeuroPanda.Издание подойдет не только писателям и копирайтерам, но и тем, кто хочет освоить контентный промт-инжиниринг для работы, учебы, обучения, досуга, саморазвития и многих других сфер жизни.5 причин купить книгуВы откроете возможности чата GPT, его фишки и закономерности.Вы получите интересные идеи промптинга (подбора запросов и подсказок чату GPT).Вы прокачаете креативность и увидите практичные примеры работы с нейросетью.Вы сможете создавать качественный контент для бизнеса, учебы, соцсетей и личной жизни.Издание не привязано к отдельным версиям GPT, поэтому подойдет всем, кто желает получить навыки промтинга (создания подсказок/ запросов для нейросетей).

Петр Панда , Арина Сычева

ОС и Сети, интернет / Программирование, программы, базы данных / Справочники

Похожие книги

Всё закончится, а ты нет. Книга силы, утешения и поддержки
Всё закончится, а ты нет. Книга силы, утешения и поддержки

«Всё закончится, а ты нет» – это книга-подорожник для тех, кто переживает темную ночь души. Для тех, кому нужна поддержка и утешение. И слова, на которые можно опереться.В новой книге Ольга Примаченко, автор бестселлеров «К себе нежно» и «С тобой я дома», рассказывает о том, за что держаться, когда земля уходит из-под ног. Как себе помочь, если приходится прощаться с тем, что дорого сердцу, – будь то человек, дом или ускользающая красота. Как прожить жизненные перемены бережно к себе – и вновь обрести опоры. Несмотря ни на что, жизнь продолжается, и в ней по-прежнему есть место мечтам, надежде и вере в лучшее.Эта книга – остров со множеством маяков, которые светят во все стороны. И каждый корабль, попавший в свой личный шторм, увидит именно тот свет, который ему нужен.В формате PDF A4 сохранён издательский дизайн.

Ольга Примаченко

Карьера, кадры / Самосовершенствование / Психотерапия и консультирование / Эзотерика / Образование и наука
Как мы меняемся (и десять причин, почему это так сложно)
Как мы меняемся (и десять причин, почему это так сложно)

Каждый из нас мечтает что-то поменять в своей жизни – избавиться от деструктивных привычек, чему-то научиться, стать более организованным или похудеть. Однако большинство так и не меняются. Психотерапевт и специалист в области психического здоровья Росс Элленхорн считает, что мы избираем неверный подход. Прежде всего нужно проанализировать, что нас удерживает от изменений. На примерах из своей практики автор подробно рассказывает о десяти основных причинах, которые не дают нам измениться. Вы сможете понять мотивы саморазрушительного поведения и вернуть веру в себя.Издание будет интересно всем, кто интересуется психологией и саморазвитием.На русском языке публикуется впервые.

Росс Элленхорн

Карьера, кадры / Управление, подбор персонала / Финансы и бизнес