Всего на сайте:
282 тыс. 988 статей

Главная | Статистика

Постановка задачи, Постановка задачи: по имеющимся данным n наблюдений за совместным изме..  Просмотрен 8

Постановка задачи: по имеющимся данным n наблюдений за совместным изменением двух переменных показателей x и y необходимо определить аналитическую зависимость , наилучшим образом описывающую данные наблюдений.

Результаты наблюдений удобно представлять в виде таблицы

Таблица 2.1

Данные наблюдений

x y
n

 

Каждая строка таблицы представляет собой результат одного наблюдения .

Поясним понятие зависимости наилучшим образом описывающей данные наблюдений. Значения , из каждой строки можно рассматривать как координаты точки на координатной плоскости xy. Совокупность всех точек составляют, так называемое, поле корреляций (рис. 2.1).

 


Рис. 2.1. Поле корреляций Рис. 2.2. Лучшая линейная регрессия

 

Зависимости соответствует некоторая кривая на плоскости. Чем ближе данная кривая подходит ко всем точкам поля корреляций, тем лучше зависимость описывает исходные данные.

Для формализации этого понятия рассмотрим разность между расчетными (теоретическими, модельными) и наблюдаемыми значениями .

Наилучшей будем считать такую зависимость, для которой сумма квадратов отклонений принимает минимальное значение, т. е.

. (2.5)

Построение уравнения регрессии предполагает решение двух задач (или, другими словами, осуществляется в два этапа):

1) спецификация модели (выбор вида аналитической зависимости );

2) оценка параметров выбранной модели (определение численных значений параметров на основе массива наблюдений).

Предыдущая статья:Лекция 7. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Следующая статья:Спецификация модели
page speed (0.0143 sec, direct)