Читаем Статистика и котики полностью

Разумеется да. И для этого существуют два очень хороших метода. Первый называется логистической регрессией, а второй — дискриминантным анализом.

Логистическая регрессия во многом похожа на линейную. Однако вместо уровня счастья в левой части уравнения стоит величина, которая позволяет рассчитать вероятность того, что данный котик счастлив. Эта величина называется логарифмом шанса.

Слово «шанс» достаточно часто встречается в русском языке, как правило, обозначая то, что ни в коем случае нельзя упустить. Но с точки зрения статистики шанс — это вероятность того, что данный котик счастлив, деленная на вероятность того, что он несчастлив.



По некоторым математическим причинам от шанса берут натуральный логарифм и подставляют эту величину в регрессионное уравнение. Если логарифм шанса будет положительным, то данный котик считается счастливым, а если отрицательным — то несчастным.



Альтернативным методом является дискриминантный анализ. Чтобы разобраться, что это такое, обратимся к рисунку.



На нем представлены счастливые котики (Барсики) и несчастные (Мурзики), а также информация о том, кто из них сколько ест. Очевидно, что Барсики едят в целом больше, и мы можем провести четкую границу между котиками по этому фактору. И если такая граница возможна, то мы делаем вывод, что фактор связан с уровнем счастья. Иной случай выглядит так.



Здесь невозможно построить такую границу, чтобы Барсики оказались по одну ее сторону, а Мурзики — по другую. Соответственно, в этом случае количество еды не связано с уровнем счастья.

Алгоритм нахождения таких границ и называется дискриминантным анализом, а формула, которая задает границы, — дискриминантной функцией. По итогу дискриминантного анализа вы получаете таблицу, в которой обозначается, по каким факторам удалось провести внятные границы, а по каким — нет.

Дискриминантный анализ может работать и с большим количеством групп. Например, если мы добавим к нашим Барсикам и Мурзикам группу философских котиков, дискриминантный анализ сможет найти границы между ними всеми. Число таких границ всегда будет на одну меньше, чем количество групп.



Если же вы являетесь поклонником регрессионного анализа, то при большом количестве групп вы можете вычислить так называемую мультиномиальную регрессию.


НЕМАЛОВАЖНО ЗНАТЬ!

Мультиколлиниарность и переобучение


С методами регрессионного и дискриминантного анализов связаны две проблемы, которые существенным образом могут испортить вам все ваши выводы.

Первая из них — проблема мультиколлиниарности — возникает в случаях, когда некоторые факторы сильно коррелируют между собой, и приводит к неустойчивости получившегося уравнения. Проявляется это в двух формах.

1. При добавлении всего одного-двух котиков в выборку это уравнение может измениться до неузнаваемости.

2. Формулы, построенные на двух сходных выборках котиков, будут различаться.



Как правило, эту проблему преодолевают тремя способами.

1. Исключают одну из коррелирующих переменных из анализа.

2. Предварительно проводят процедуру факторного анализа (о нем будет рассказано далее), заменяющего эти переменные одной искусственной, которая и будет включена в регрессию.

3. Проводят процедуру пошаговой регрессии. Такая регрессия постепенно включает в уравнение по одной переменной и сразу же после этого пересчитывает вклад всех остальных. В итоге если одна из коррелирующих переменных была выбрана в качестве фактора, вторая туда скорее всего не попадет.

Вторая проблема — проблема переобучения — заключается в том, что уравнение, полученное на одних котиках, может не работать на других. Она возникает из-за того, что в вашей выборке котиков могут быть закономерности, которые нехарактерны для котиков в целом. И зачастую они попадают в регрессионную модель.



Для того чтобы предотвратить переобучение, используют критерий, который искусственно ограничивает количество факторов, включенных в уравнение (например критерий Акаике и Байесовский информационный критерий).

Глава 12.

Котиковые аналоги

или основы математического моделирования

В предыдущих разделах мы подробно рассмотрели метод регрессионного анализа, который позволяет построить уравнение, описывающее, как различные вещи влияют на настроение котиков. Подобные уравнения входят в группу объектов, называющихся математическими моделями.

Математическая модель — это своего рода аналог котика, который позволяет изучать его поведение без проведения реальных экспериментов. Как правило, это значительно удешевляет исследования.



Все математические модели делятся на функциональные и структурные. Функциональные модели, к которым, к слову, относится регрессионное уравнение, — описывают влияние внешних факторов на котиковое состояние. Например, известная нам модель котикового счастья.



Перейти на страницу:

Похожие книги

23 тайны: то, что вам не расскажут про капитализм
23 тайны: то, что вам не расскажут про капитализм

Экономисты утверждают, что инфляция находится под жестким контролем…Но люди видят лишь постоянное повышение цен.Экономисты утверждают, что мы живем в эпоху свободного рынка…Однако правительства едва ли не всех стран мира в большей или меньшей степени планируют бюджет.Экономисты утверждают, что уровень образования напрямую связан с уровнем зарплаты…Однако молодые ученые по-прежнему переезжают из страны в страну в поисках достойных условий существования.Экономисты утверждают, что зарплаты постоянно растут, а уровень жизни повышается…Так почему тысячи людей уверены, что живут все хуже и хуже?Автор этой книги разоблачает самые распространенные мифы рыночной экономики и призывает читателей мыслить самостоятельно и основывать свои решения на здравом смысле, а не на теориях, зачастую не выдерживающих испытания реальностью!

Ха-Джун Чанг , Ха Джун Чхан

Экономика / Финансы и бизнес
Институциональная экономика. Новая институциональная экономическая теория
Институциональная экономика. Новая институциональная экономическая теория

Учебник институциональной экономики (новой институциональной экономической теории) основан на опыте преподавания этой науки на экономическом факультете Московского государственного университета им. М.В. Ломоносова в 1993–2003 гг. Он включает изложение общих методологических и инструментальных предпосылок институциональной экономики, приложение неоинституционального подхода к исследованиям собственности, различных видов контрактов, рынка и фирмы, государства, рассмотрение трактовок институциональных изменений, новой экономической истории и экономической теории права, в которой предмет, свойственный институциональной экономике, рассматривается на основе неоклассического подхода. Особое внимание уделяется новой институциональной экономической теории как особой исследовательской программе. Для студентов, аспирантов и преподавателей экономических факультетов университетов и экономических вузов. Подготовлен при содействии НФПК — Национального фонда подготовки кадров в рамках Программы «Совершенствование преподавания социально-экономических дисциплин в вузах» Инновационного проекта развития образования….

Александр Александрович Аузан

Экономика / Религиоведение / Образование и наука
Исповедь экономического убийцы
Исповедь экономического убийцы

Книга Дж. Перкинса — первый в мире автобиографический рассказ о жизни, подготовке и методах деятельности особой сверхзасекреченной группы «экономических убийц» — профессионалов высочайшего уровня, призванных работать с высшими политическими и экономическими лидерами интересующих США стран мира. В книге–исповеди, ставшей в США и Европе бестселлером, Дж. Перкинс раскрывает тайные пружины мировой экономической политики, объясняет странные «совпадения» и «случайности» недавнего времени, круто изменившие нашу жизнь.Автор предисловия и редактор русского издания лауреат премии «Лучшие экономисты РАН» доктор экономических наук, профессор Л.Л.Фитуни, руководитель Центра глобальных и стратегических исследований ИАФ РАНКнига впервые была опубликована Berrett-Koehler Publishers, Inc., San Francisco,CA, USA. Все права защищены.© Pretext, 2005 Authorized translation into Russian© 2004 Berrett-Koehler Publishers, Inc.© 2004 by John Perkins© Леонид Леонидович Фитуни, предисловие, научная редакция русского издания, 2005Перевод - к.ф.н. Мария Анатольевна Богомолова

Джон М. Перкинс , Джон Перкинс

Экономика / История / Политика / Образование и наука / Финансы и бизнес
Создание фундамента социалистической экономики в СССР (1926—1932 гг.)
Создание фундамента социалистической экономики в СССР (1926—1932 гг.)

«История социалистической экономики СССР» в семи томах охватывает период от первых революционно-экономических преобразований после победы Великого Октября до создания и упрочения экономики развитого социализма. Такой обобщающий труд по истории советской экономики издается впервые.«История социалистической экономики СССР» ставит своей целью исследовать практическое использование, воплощение в жизнь основных закономерностей построения социалистической экономики, освещает особенности их проявления в конкретных условиях Советской страны на определенных этапах социалистического строительства; в работе дается анализ практического использования социалистическим государством экономических законов социализма для успешного развития производительных сил и новых общественных отношений, создания материально-технической базы коммунизма.Работа выполнена в Институте экономики АН СССР, в Отделе изучения экономической мысли и обобщения опыта развития социалистической экономики.Книга содержит таблицы. — DS.Концы страниц размечены в теле книги так: <!-- 123 -->, для просмотра номеров страниц следует открыть файл в браузере. — DS.

авторов Коллектив , Коллектив авторов

Экономика / История / Образование и наука / Финансы и бизнес