ТЕМА 5: МОДЕЛЬ ПАРНОЙ РЕГРЕССИИ
Цель: Познакомить со спецификацией
модели парной регрессии, оценкой сущности параметров линейной уравнению
регрессии и корреляции, с интервалами прогноза по линейному уравнению
регрессии, нелинейной регрессией.
План:
5.1 Спецификация модели
5.2 Оценка значимости
параметров линейной регрессии и корреляции
5.3 Интервалы прогноза по
линейному уравнению регрессии
5.4 Нелинейная регрессия.
Корреляция для нелинейной регрессии
5.5 Средняя ошибка апроксимации
5.1 Спецификация модели
В зависимости от количества факторов, включенных в
уравнение регрессии различают простую парную и множественную регрессии. Простая
регрессия представляет собой
регрессию между двумя
переменными - у и х,
т.е. модель вида:
.
Уравнение простой регрессии характерезует связь
между двумя переменными, которая
проявляется как некоторая закономерность лишь в среднем по совокупности
наблюдений.
Величина
у
складывается из двух слагаемых: ![]()
Случайная
величина
называется также
возмущением. Она включает влияние неучтенных в модели факторов, случайных
ошибок и особенностей измерения и др.
Решение
задачи построения качественного уравнения регрессии состоит из следующих трех
этапов: выбор формулы уравнения регрессии; определение параметров выбранного
уравнения; анализ качества уравнения и проверка адекватности уравнения
эмпирическим данным, совершенствование уравнения.
Выбор
формулы связи переменных называется спецификацией
уравнения регрессии. В парной регрессии выбор вида
математической функции
может быть осуществлен
тремя методами: графическим, аналитическим (т.е. исходя из теории
изучаемой взаимосвязи) и экспериментальным.
Основные типы кривых, используемые при количественной оценке связей
представлены на рисунке.
а)
б)
в) ![]()
г)
д)
е) ![]()
5.2 Оценка значимости параметров линейной регрессии и корреляции
Классический
подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). В результате решения методом
наименьших квадратов получают систему нормальных уравнений, из которой получают
оценки параметров a и b:
,
или
. Параметр b
называется коэффициентом регрессии.
Его величина показывает среднее изменение результата с изменением фактора на
одну единицу.
Коэффициент
корреляции:
, если b>0,
то
:
, и при b<0,
.
Для
оценки качества подбора линейной функции рассчитывается коэффициент детерминации:
.
Оценка
значимости уравнения регрессии, в целом, дается с помощью F–критерия Фишера:
или
.
Английским
ученым Снедеккором разработаны таблицы критических значений
F–отношений при различных
уровнях существенности нулевой гипотезы (уровень значимости
) и различном числе степеней свободы. Если
>
уравнение регрессии считается статистически значимым.
В линейной регрессии обычно оценивается не только уравнение в целом, но
и отдельные его параметров. По каждому из параметров определяется его
стандартная ошибка:
и
. Стандартная ошибка b: 
Для
оценки существенности коэффициента регрессии расчитывается
-критерий Стьюдента:
, значение которого сравнивается с табличным значением при
уровне значимости
и числе степеней
свободы (n-m). Если
>
, то гипотеза о несущественности коэффициента регрессии
отклоняется.
Доверительный
интервал определяется как
, где
- предельная ошибка
коэффициента регрессии
, т.е.:
или
.
Стандартная
ошибка параметра а:
.
Процедура
оценивания существенности параметра а
аналогична как и для параметра b.
Значимость
линейного коэффициента корреляции проверяется на основе величины ошибки
коэффициента корреляции
:
. Фактическое значение
-критерия Стьюдента определяется как:
. Поскольку
, то
. Если
, то коэффициент корреляции существенно отличен от нуля и
зависимость является достоверной.
5.3 Интервалы прогноза по
линейному уравнению регрессии
В
прогнозных расчетах по уравнению регрессии определяется предсказываемое
значение (
) как точечный прогноз
при
, т.е. путем подстановки в уравнение
регрессии соответствующего значения х.
Интервальная
оценка прогнозного значения (
):
где
- стандартная ошибка
предсказываемого по уравнению регрессии значения, при
: 
5.4 Нелинейная регрессия. Корреляция
для нелинейной регрессии
Если
между экономическими явлениями существуют нелинейные соотношения, то они
выражаются нелинейными функциями. Различают два класса нелинейных регрессий:
- регрессии, нелинейные относительно включенных в анализ объясняющих переменных,
но линейные по оцениваемым параметрам;
- регрессии, нелинейные по
оцениваемым параметрам.
Второй
класс нелинейных моделей по оцениваемым параметрам подразделяется на два типа:
нелинейные модели внутренне линейные, нелинейные модели внутренне нелинейные.
Нелинейные модели внутренне линейные путем логарифмирования по основанию е приводят к линейному виду.
Индекс
корреляции (R):
или
.
Величина
R находится в границах:
, чем ближе к 1 (единице), тем теснее связь рассматриваемых
признаков, тем более надежно найденное уравнение регрессии.
Индекс
детерминации
имеет тот же смысл,
что и коэффициент детерминации, который используется для проверки
существенности в целом уравнения нелинейной регрессии по F–критерию Фишера:
5.5 Средняя ошибка аппроксимации
Величина
(у-
) по каждому наблюдению представляет собой ошибку аппроксимации. Их число
соответствует объему совокупности. Отклонения (у-
) несравнимы между собой. Для сравнения используются величины
отклонений (у-
), выраженные в процентах к фактическим значениям. Поскольку
(у-
) может быть и отрицательной величиной, то ошибки аппроксимации
для каждого наблюдения принято определять в процентах по модулю:
- абсолютная ошибка
аппроксимации, а
- относительная.
Для
общей оценки о качестве модели из относительных отклонений по каждому
наблюдению определяют среднюю ошибку аппроксимации как среднюю арифметическую
простую:
.
Средняя
ошибка аппроксимации в пределах 5-7% свидетельствует о хорошем подборе модели к
исходным данным.
Литература: 1, с. 18-34; 2, с. 14-36;
3, с. 50-80; 4, с. 5-49; 5, с. 6-47;
6,
с. 43-109; 10, с. 45-57; 12, с. 46-56
Контрольные вопросы:
1.
Что такое простая парная регрессия?
2.
Какая случайная величина называется возмущенной?
3.
Из каких этапов состоит решение задачи построения качественного уравнения регрессии?
4.
Что называется спецификацией уравнения регрессии?
5.
Какими методами в парной регрессии может быть осуществлен выбор вида
математической функции
?
6. Какие основные типы
кривых, используются при количественной оценке связей?
7. Что показывает величина
коэффициента регрессии?
8. Чему равен коэффициент
корреляции?
9. Как рассчитывается
коэффициент детерминации?
10. Что определяется с
помощью F–критерия Фишера?
11. Чему равен
F–критерий Фишера?
12. Чему равны стандартные
ошибки
и
?
13. Как определяется
доверительный интервал?
14.
Что определяется на основе величины ошибки коэффициента корреляции
?
15. Чему равно фактическое значение
-критерия Стьюдента?
16. Как определяются
интервалы прогноза по
линейному уравнению регрессии?
17. Какие различают два
класса нелинейных регрессий?
18. Как определяется индекс
корреляции?
19. Как определяется индекс детерминации
?
20. Чему равна средняя
ошибка аппроксимации?