Нелинейная регрессия
Выбираем автоматическое построение графика «аппроксимации»:
Residuals — Line Fit Plots
Остатки — График подбора
.На экране появляются два загадочных графика.
Графики аппроксимации
Чтобы понять, почему появилось два графика вместо одного, заглянем в исходные данные второй диаграммы. Щёлкнем правой кнопкой по графику и выберем
Select Data
Выбрать данные
.В этой диаграмме использованы два набора данных: y
(исходные «игреки») и Predicted y (прогноз значений «игрека» по уравнению регрессии). В окнеSelect Data Source
Выбор источника данных
выберем строчку y
и нажмёмEdit
Изменить
.Данные для второй диаграммы
Рассмотрим, какие данные были выбраны для диаграммы. Нужные сведения выводятся в окне
Edit Series
Изменение ряда
.Выясняется, что по горизонтальной оси были выбраны квадраты «иксов».
Данные для второй диаграммы
Оставляем только первый график, а второй — удаляем. Теперь настроим наш график аппроксимации и рассмотрим его поподробней.
«График» параболы
Вместо ЛИНИИ регрессии можно видеть странную фигуру, которая утолщается в середине и сужается по краям. Причина в том, что соседние точки на графике соединяются отрезками. Но эти точки идут в том же порядке, как в исходной таблице, а там данные расположены в случайном порядке, не по возрастанию. Придётся кое-что подправить.
Скопируем столбец «иксов» и вставим на место столбца
Observation
Наблюдение
в таблицу
RESIDUAL OUTPUT
ВЫВОД ОСТАТКА
.Столбец Observation
содержит порядковые номераТретий столбец
Residuals
Остатки
нам для работы не потребуется — мы его просто удаляем.
Таблица прогнозов
Теперь у нас есть пары соответствующих «иксов» и «игреков». Отсортируем их по возрастанию. Для этого выделяем диапазон данных в столбцах Х
иPredicted y
Предсказанное Y
.Вызываем сортировку через верхнее меню:
Home — Editing — Sort & Filter — Sort Smallest to Largest
Главная — Редактирование — Сортировка и фильтр — Сортировка по возрастанию
.Сортировка по возрастанию
Сортировка ячеек выделенного диапазона выполняется по возрастанию чисел в первом столбце. Это значит, что «иксы» выстраиваются по возрастанию, а соответствующие им «игреки» перемещаются вслед за своими «иксами».
Отсортированные данные
Теперь изменим диапазоны ячеек для Predicted y
в данных для графика:Select Data — Select Data Source — Legend Entries (Series) — Predicted y — Edit
.Выбор данных — Выбор источника данных — Легенда — Предсказанное Y — Изменить
.Данные для Predicted y
Вместо столбца исходных «иксов» выбираем отсортированные «иксы» из вспомогательной таблицы. Диапазон для прогноза «игреков» оставляем тем же.
Отсортированные Predicted y
Теперь линия регрессии на графике стала похожа на линию. Поскольку мы генерировали исходные данные с помощью уравнения прямой линии, в наших точках особой «кривизны» не наблюдается. Так что мы видим участок параболы с очень небольшой кривизной.
График по отсортированным данным
Перейдём к уравнению регрессии. Надстройка выдаёт нам оценки коэффициентов уравнения. Заголовки строк указывают, к чему относится каждый коэффициент:
Intercept
— свободный член уравнения;x
— «иксы»;x2
— квадраты «иксов».В исходной таблице мы сделали красивый заголовок для квадратов «икса»
Оценки коэффициентов
Берём коэффициенты и записываем уравнение регрессии. Нам понадобится несколько ячеек. Используем ссылки на ячейки с оценками коэффициентов.
Уравнение регрессии
Коэффициент при квадрате «икса» небольшой. С учётом величины квадрата «икса» получаем небольшой вклад в общий результат — на фоне остальных членов уравнения. Сравним вклад членов уравнения для среднего значения аргумента. Вычисления округлим до целых:
x = 1 500
x2
= 2 250 000.Свободный член: 1 086
.Вклад х
: 1,0733 * 1500 = 1 610.Вклад х2
: 0,000 137 * 1 500 * 1 500 = 308.Относительный вклад х2
:308 / (1086 +1610 +308) * 100% = 10%
.Получается, что нелинейная часть уравнения даёт всего 10% изменения результативного признака.
Чтобы построить уравнение третьей степени, повторите описанные шаги для диапазона ячеек, дополнительно включающего столбец третьих степеней «иксов».