Начиная с этого момента, мы будем предполагать, что
(1) Модель наблюдений имеет форму
где
— значение растолковываемой переменной в
-м наблюдении;
— известное значение
-ой растолковывающей переменной в
-м наблюдении;
— малоизвестный коэффициент при
-ой растолковывающей переменной;
— случайная составляющая (“неточность“) в
-м наблюдении.
(2)
— случайные размеры, свободные в совокупности, имеющие однообразное обычное распределение N (0,s2) с нулевым дисперсией и математическим ожиданием
(3)Если не оговорено неприятное, то в число растолковывающих переменных включается переменная, тождественно равная единице, которая объявляется первой растолковывающей переменной, так что
При сделанных догадках
являются замечаемыми значенияминормально распределенных случайных размеров
,каковые свободны в совокупности и для которых
~
В отличие от
,случайные размеры
имеют распределения, отличающиеся сдвигами.
Определенную указанным образом модель наблюдений мы будем именовать обычной линейной моделью с pобъясняющими переменными. В противном случае ее еще именуют обычной линейной моделью множественной регрессии переменной y на переменные x1, … , xp . Термин “множественная” говорит о использовании в правой части модели наблюдений двух и более растолковывающих переменных, хороших от постоянной. Термин “регрессия” имеет определенные исторические корни и употребляется только в силу традиции.
Оценивание малоизвестных коэффициентов модели способом мельчайших квадратов пребывает в минимизации по всем вероятным значениям
суммы квадратов
Минимум данной суммы достигается при некоем комплекте значений коэффициентов
так что
Это минимальное значение мы снова обозначаем RSS , так что
и именуем остаточной суммой квадратов.
Коэффициент детерминации R2 определяется как
где
Обозначая
РЕГРЕССИОННЫЙ АНАЛИЗ STATISTICA #12