Приросты считаются так:
Абсолютный прирост = Текущий показатель – Базисный показатель (прошлый месяц, аналогичный месяц прошлого года и т. д.).
Относительный прирост = Текущий показатель / Базисный показатель – 1.
240. Мода, медиана и среднее
Сначала дадим определения:
• среднее арифметическое – сумма всех элементов выборки, разделенная на их количество;
• мода – значение, которое встречается чаще всего;
• медиана – такое число из выборки, что ровно половина элементов этой выборки больше него, а половина – меньше.
В качестве среднего могут указывать и среднее, и медиану, и моду. В компании с огромной зарплатой руководителя и низкими зарплатами сотрудников будет высокая средняя зарплата, не очень высокая медианная (то есть зарплата человека, которая меньше зарплаты половины сотрудников и больше зарплаты другой половины сотрудников) и совсем невысокая мода (то есть зарплата, чаще всего встречающаяся в компании).
Рассмотрим простой пример в числах.
Пусть в компании есть восемь руководителей, которые получают по 3 тысячи неких денежных единиц, 20 сотрудников, получающих по 2 тысячи единиц, и 27 сотрудников, которые получают по 200 единиц.
Средняя зарплата в компании = 69 400 / 55 = 1261 денежная единица.
Медиана = 2 тысячи единиц. Это зарплата того человека, который «богаче» одной половины коллег и «беднее» другой половины.
Мода = 200 единиц, это самая часто встречающаяся зарплата.
Когда какой показатель использовать?
На практике мода используется редко. Намного больший интерес представляют среднее и медиана.
Среднее арифметическое крайне чувствительно к выбросам (нехарактерным для изучаемой выборки слишком большим или слишком малым значениям) одно случайное экстремальное значение может сильно сместить ваше среднее.
Медиана же к выбросам устойчива.
Выбор между медианой и средним зависит от целей исследования и от характера данных. Если экстремальные значения полагаются случайными или возникающими вследствие внешних причин или ошибок, медиана – более предпочтительный показатель.
Если имеете дело со статистикой и слышите про «среднее» – лучше поинтересоваться, как именно его рассчитывали.
241. Взвешенное среднее
Взвешенное среднее – то, при котором значения усредняемого показателя умножаются на определенные веса (например, на объем или количество).
Допустим, у вас в магазине есть 20 тысяч книг по 500 рублей, 10 тысяч книг по 600 рублей и 3 тысячи книг по 850 рублей. Какова средняя цена книги из вашего ассортимента? Количество книг здесь будет весом, а цена – усредняемым показателем.
На практике для расчета этого показателя можно применять функцию СУММПРОИЗВ (SUMPRODUCT) в Excel. Она позволяет перемножить несколько массивов. В данном примере она будет выглядеть так:
242. Квантили
Еще один интересный показатель в статистическом анализе – это квантили. Чаще всего встречаются 1 %-, 5 %-, 95 %-, 99 %-ный квантили. Рассмотрим на примере: пусть 95 %-ный квантиль зарплат в регионе составляет 1 тысячу денежных единиц. Это значит, что 95 % населения получает менее 1 тысячи единиц (или 95 человек из 100 получают менее 1 тысячи единиц). Аналогично, если 5 %-ный квантиль составляет 200 единиц, то 5 % населения зарабатывает менее 200 единиц.
Квантили удобны, когда необходимо получить интервал, в который с высокой вероятностью попадают все интересующие вас объекты исследования. Или когда вам необходимо отфильтровать экстремальные значения.
Для нахождения квантилей используйте функции Excel:
• в старых версиях Excel: КВАРТИЛЬ (QUARTILE);
• в Google Таблицах: QUARTILE;
• в новых версиях Excel: КВАРТИЛЬ.ВКЛ/КВАРТИЛЬ.ИСКЛ (QUARTILE.INC/ QUARTILE.EXC).
Первый аргумент функции – массив данных, а второй – значение процентиля (например, 0,05 или 0,95).
243. Как найти выбросы?
Что такое выбросы? Это данные, нетипичные для конкретной выборки, способные исказить статистические показатели (например, среднее), рассчитанные по ней.
Откуда они появляются? Выбросы могут возникать из-за ошибок ввода информации, неправильного сбора данных, а также по причинам, не связанным с темой исследования (например, в какой-то месяц были низкие продажи из-за внешних факторов – проблем дистрибьютора, какого-то форс-мажора на рынке).
Если вернуться к примеру с заработной платой из бизнесхака «Медиана, мода и среднее»
, то зарплата руководителя – это не выброс.Выбросы можно и нужно удалять, и делают это как вручную, так и автоматически.
Если у вас мало данных (например, статистика по продажам за два-три года по месяцам), то убрать их можно вручную, экспертно оценив, есть ли нетипичные данные в выборке (их может и не быть вовсе, особенно в небольшой выборке).