Читаем Статистика и котики полностью

2. На основе этих признаков вы вычисляете степень похожести котиков (чаще используется термин расстояние).

3. Котики последовательно объединяются в группы. Это может происходить так, как было описано выше (так называемый «метод ближайшего соседа»), а может и по другим принципам.

4. По итогу вы получаете график, называемый дендрограммой. По ней вы можете определить, на какие группы делятся ваши котики и какие котики к какой группе принадлежат. Единственное — если котиков очень много, воспринимать такую дендрограмму довольно сложно.



Напомним, что иерархический кластерный анализ позволяет вам разбить котиков на группы, когда вы не знаете, сколько у вас их должно получиться. А если знаете, то более адекватным будет использование метода k-средних.

Идея достаточно проста. Предположим, вы подозреваете, что все котики делятся на три различающиеся размером группы. Тогда у каждой группы существует свой представитель, который обладает самым типичным для группы размером. Такой котик называется центроидом. И основная задача алгоритма k-средних — найти, каким именно размером эти центроиды обладают.

Происходит это пошагово. На первом этапе мы произвольно расставляем центроиды.



На втором этапе вычисляются расстояния от каждого котика до каждого центроида.



На третьем — определяем принадлежность котиков к тому или иному центроиду. Иными словами — смотрим, какой котик к какому центроиду ближе.



И на четвертом этапе мы вычисляем средний размер котиков при каждом центроиде. И центроид перемещается в этот средний размер.



А потом алгоритм повторяется со второго шага. Происходит это потому, что некоторые котики перебегают от одного центроида к другому, вследствие чего положение центроидов также будет меняться.

Происходит это ровно до тех пор, пока после очередного повторения положение центроидов останется неизменным.



Важно отметить следующие вещи. Во-первых, k-средних может работать сразу по нескольким переменным. Для этого, как и для иерархического кластерного анализа, вычисляется расстояние, но уже не между отдельными котиками, а между конкретным котиком и центроидом.

Во-вторых, результат k-средних сильно зависит от начального положения центроидов. Некоторые такие положения могут приводить к довольно-таки бредовым результатам. Поэтому k-средних лучше проводить несколько раз подряд. Кстати, если вы при этом каждый раз получаете разные результаты, стоит задуматься о смене количества групп.


НЕМАЛОВАЖНО ЗНАТЬ!

Метрики расстояний


Конкретные результаты кластерного анализа во многом зависят от того, какую метрику расстояния вы выбрали. А их существует несколько. Самая простая из них — эвклидово — есть просто кратчайший путь между двумя точками.



Иногда вместо него используют так называемое Манхэттенское расстояние. Названо оно было в честь Манхэттена, а точнее — в честь его планировки. Прогуливаясь по Манхэттену, вы не можете попасть из точки А в точку Б по кратчайшему пути. Если только вы не можете проходить сквозь стены, вам обязательно придется идти вдоль его параллельно-перпендикулярных улиц.



Заметим, что синий и красный пути абсолютно одинаковы. Манхэттенское расстояние лучше использовать в случаях, если вы подозреваете, что в вашей выборке есть выбросы.

Последняя наиболее часто используемая метрика — это расстояние Чебышева. Она немного похожа на Манхэттенское расстояние. Но только чуть-чуть. Потому что его можно определить как максимальное расстояние, которое котику нужно будет пройти вдоль одной улицы.


Глава 14.

О котиковом характере

или основы факторного анализа

Безусловно, каждый котик — уникальная и сложная личность. У него есть индивидуальные желания и предпочтения, а также собственный взгляд на мир и свое место в нем. Впрочем, некоторые психологические особенности (например, любовь к еде) являются общими для всех котиков.



Однако, к большому сожалению, в отличие от всяких внешних признаков (к примеру таких, как размер или пушистость), психологические особенности не так просто измерить, поскольку их нельзя увидеть. И потому мы нуждаемся в специальных методах для их выявления.

В качестве примера вспомним, что большинство котиков склонны точить когти о диван и время от времени царапать своих хозяев. При этом мы наблюдаем линейную положительную взаимосвязь между этими явлениями — котики, которые дерут большее количество диванов, склонны оставлять большее количество царапин.



Глядя на эту взаимосвязь, мы можем предположить, что за этими склонностями стоит некоторая скрытая причина, которая вполне может являться особой чертой котикового характера. Назовем ее царапучестью. Чем выше царапучесть, тем больше котики склонны царапать диваны и людей.



Перейти на страницу:

Похожие книги

23 тайны: то, что вам не расскажут про капитализм
23 тайны: то, что вам не расскажут про капитализм

Экономисты утверждают, что инфляция находится под жестким контролем…Но люди видят лишь постоянное повышение цен.Экономисты утверждают, что мы живем в эпоху свободного рынка…Однако правительства едва ли не всех стран мира в большей или меньшей степени планируют бюджет.Экономисты утверждают, что уровень образования напрямую связан с уровнем зарплаты…Однако молодые ученые по-прежнему переезжают из страны в страну в поисках достойных условий существования.Экономисты утверждают, что зарплаты постоянно растут, а уровень жизни повышается…Так почему тысячи людей уверены, что живут все хуже и хуже?Автор этой книги разоблачает самые распространенные мифы рыночной экономики и призывает читателей мыслить самостоятельно и основывать свои решения на здравом смысле, а не на теориях, зачастую не выдерживающих испытания реальностью!

Ха-Джун Чанг , Ха Джун Чхан

Экономика / Финансы и бизнес
Институциональная экономика. Новая институциональная экономическая теория
Институциональная экономика. Новая институциональная экономическая теория

Учебник институциональной экономики (новой институциональной экономической теории) основан на опыте преподавания этой науки на экономическом факультете Московского государственного университета им. М.В. Ломоносова в 1993–2003 гг. Он включает изложение общих методологических и инструментальных предпосылок институциональной экономики, приложение неоинституционального подхода к исследованиям собственности, различных видов контрактов, рынка и фирмы, государства, рассмотрение трактовок институциональных изменений, новой экономической истории и экономической теории права, в которой предмет, свойственный институциональной экономике, рассматривается на основе неоклассического подхода. Особое внимание уделяется новой институциональной экономической теории как особой исследовательской программе. Для студентов, аспирантов и преподавателей экономических факультетов университетов и экономических вузов. Подготовлен при содействии НФПК — Национального фонда подготовки кадров в рамках Программы «Совершенствование преподавания социально-экономических дисциплин в вузах» Инновационного проекта развития образования….

Александр Александрович Аузан

Экономика / Религиоведение / Образование и наука
Исповедь экономического убийцы
Исповедь экономического убийцы

Книга Дж. Перкинса — первый в мире автобиографический рассказ о жизни, подготовке и методах деятельности особой сверхзасекреченной группы «экономических убийц» — профессионалов высочайшего уровня, призванных работать с высшими политическими и экономическими лидерами интересующих США стран мира. В книге–исповеди, ставшей в США и Европе бестселлером, Дж. Перкинс раскрывает тайные пружины мировой экономической политики, объясняет странные «совпадения» и «случайности» недавнего времени, круто изменившие нашу жизнь.Автор предисловия и редактор русского издания лауреат премии «Лучшие экономисты РАН» доктор экономических наук, профессор Л.Л.Фитуни, руководитель Центра глобальных и стратегических исследований ИАФ РАНКнига впервые была опубликована Berrett-Koehler Publishers, Inc., San Francisco,CA, USA. Все права защищены.© Pretext, 2005 Authorized translation into Russian© 2004 Berrett-Koehler Publishers, Inc.© 2004 by John Perkins© Леонид Леонидович Фитуни, предисловие, научная редакция русского издания, 2005Перевод - к.ф.н. Мария Анатольевна Богомолова

Джон М. Перкинс , Джон Перкинс

Экономика / История / Политика / Образование и наука / Финансы и бизнес
Создание фундамента социалистической экономики в СССР (1926—1932 гг.)
Создание фундамента социалистической экономики в СССР (1926—1932 гг.)

«История социалистической экономики СССР» в семи томах охватывает период от первых революционно-экономических преобразований после победы Великого Октября до создания и упрочения экономики развитого социализма. Такой обобщающий труд по истории советской экономики издается впервые.«История социалистической экономики СССР» ставит своей целью исследовать практическое использование, воплощение в жизнь основных закономерностей построения социалистической экономики, освещает особенности их проявления в конкретных условиях Советской страны на определенных этапах социалистического строительства; в работе дается анализ практического использования социалистическим государством экономических законов социализма для успешного развития производительных сил и новых общественных отношений, создания материально-технической базы коммунизма.Работа выполнена в Институте экономики АН СССР, в Отделе изучения экономической мысли и обобщения опыта развития социалистической экономики.Книга содержит таблицы. — DS.Концы страниц размечены в теле книги так: <!-- 123 -->, для просмотра номеров страниц следует открыть файл в браузере. — DS.

авторов Коллектив , Коллектив авторов

Экономика / История / Образование и наука / Финансы и бизнес