На графике видно, что линия регрессии проходит посредине между точками данных. Введя значение температуры X в уравнение, можно определить
Однако насколько точно данное уравнение позволяет прогнозировать продажи мороженого? Чтобы ответить, нужно присмотреться к другому числу в таблице.
R-квадрат: разъяснение
Значение
Однако будьте бдительны! Не придавайте излишнего значения результатам регрессионного анализа! Они говорят нам только то, что объем продаж определенным образом изменяется при изменении температуры. Из этого анализа не следует, что «температура всегда влияет на объем продаж». Но если вы рационально и обоснованно выбрали независимую переменную и она хорошо предсказывает поведение зависимой переменной, значит, метод годится.
Регрессионный анализ выявляет не только позитивную, как в случае с температурой воздуха и объемом продаж мороженого, но и негативную корреляцию, например, процентных ставок и объема продаж жилья. Если процентные ставки слишком высоки, объем продаж низок и коэффициент X имеет отрицательное значение. С точки зрения прогнозирования подобные негативные зависимости так же полезны, как позитивные.
Погрешность оценки: разъяснение
«Среднеквадратичная погрешность оценки Y» и «среднеквадратичная погрешность коэффициента X» – синонимы
T – статистика как критерий надежности
T-статистика может подсказать, пригодно ли для прогнозирования уравнение регрессии, рассчитанное компьютерной программой: T-статистика проверяет, оказывает ли переменная X статистически значимое влияние на Y, как, например, температура воздуха – на объем продаж. Для определения данного критерия следует разделить коэффициент X на его среднеквадратичную погрешность. Если T-статистика окажется больше 2 или меньше –2, переменная X оказывает статистически значимое влияние на Y. В нашем примере критерий имеет очень высокое значение: 16431/3 367 = 4,88 (см. табл. 5.5). Поэтому аналитик делает вывод, что по температуре можно с высокой достоверностью прогнозировать объем продаж.
Модель прогнозирования подходит при высоких значениях и R, и T-статистики. Можно разработать модель более чем с одной переменной X. Мы будем иметь дело с
Анализ методом регрессии с фиктивными переменными
Один из приемов регрессионного анализа – метод
Используя гипотетическую совокупность данных по магазину Toys “R” Us, можно понять, как работают эти переменные (табл. 5.6).
Выводы регрессивного анализа устанавливают отношения между модной игрушкой и уровнем продаж:
Это идеальная модель, поскольку разброс на 100 % объясняется среднеквадратичной погрешностью, и T-статистика работает прекрасно. T-статистика огромна. Уровень продаж составляет $100 000, когда модная игрушка отсутствует в ассортименте, и увеличивается на $100 000, когда она появляется. Уравнение регрессии по данным электронной таблицы имеет вид: