Всего на сайте:
210 тыс. 306 статей

Главная | Статистика

Множественная корреляция  Просмотрен 424

 

При множественной корреляции устанавливают зависи­мость результативного признака от двух или более независи­мых факторов. В отличие от парного анализа он позволяет учесть влияние на результативный показатель комплекса различных факторов, более полно оценить вариацию результативного показателя.

При отборе факторов также необходимо учитывать корреляционную зависимость их между собой, поскольку факторы, влияющие на результативный показатель, должны быть независимыми друг от друга. В случае высокой корреляции факторов между собой возникает явление, называемое мультиколлинеарностью, которое искажает величину коэффициентов регрессии, затрудняет их интерпретацию. Для избежания мультиколлинеарности производят отсев факторов с помощью парных коэффициентов корреляции. Исключают один из двух факторов, если корреляция их между собой выше, чем корреляция каждого с результативным признаком

Отсев факторов производят также и при оценке значимости коэффициентов регрессии. Об этом подробнее будет сказано ниже. Важное значение, как и при парной корреляции, имеет выбор формы связи. Однако это довольно сложная задача, поскольку факторы оказывают влияние не только на результативный показатель, но и взаимодействуют с собой. В настоящее время вопросы выбора формы связи при множественной корреляции разработаны еще недостаточно. В большинстве случаев для анализа используют уравнение множественной линейной регрессии:

,

где - результативный признак;

х1, х2, …, хm – факторные признаки;

а0 – начало отсчета;

а1, а2, …, аm – коэффициенты регрессии.

Определение параметров уравнения, как и при парной корреляции, обычно осуществляется методом наименьших квадратов. Для этого решают систему нормальных уравнений:

Коэффициенты регрессии множественной связи показыва­ют, на сколько изменится величина результативного показа­теля при изменении значения фактора на единицу при неиз­менном значении остальных факторов.

Общая оценка полученного уравнения проводится с помо­щью индекса корреляции, который при множественной линей­ной связи называют коэффициентом множественной корреля­ции:

или ,

где R – коэффициент множественной корреляции;

- общая дисперсия результативного признака;

- факторная дисперсия результативного признака;

- остаточная дисперсия результативного признака.

Коэффициент множественной корреляции показывает сте­пень зависимости результативного признака от факторных признаков. Также как индекс корреляции при парной зави­симости, он меняется в пределах от 0 до 1.

Квадрат коэффициента множественной корреляции назы­вают коэффициентом множественной детерминации R2. Он показывает долю общей вариации результативного признака, определяемую всеми факторными признаками, их совокупным действием.

При анализе силы влияния факторов на результативный показатель применяют также частные коэффициенты корреляции, которые показывают тесноту связи результативного показателя с одним из факторов при исключении влияния других:

,

где - частный коэффициент корреляции;

- факторная дисперсия результативного признака при исключении влияния фактора хi.

Квадраты коэффициентов частной корреляции называют коэффициентами частной детерминации. Они показывают, какую часть вариации можно объяснить, включив в уравнение регрессии новый фактор, то есть роль фактора в сокращении остаточной вариации.

Существенность коэффициента множественной корреляции и всего уравнения регрессии в целом оценивают с помощью F-критерия Фишера или t-критерия Стьюдента. Фактические их значения рассчитывают по формулам:

,

(для большой выборки),

(для малой выборки),

где n – численность выборочной совокупности;

k – число параметров в уравнении регрессии.

Полученные значения F-критерия и t-критерия сравнивают с их табличными значениями. При этом число степеней свободы вариации для F-критерия принимают и , для t-критерия - . Если фактические значения критериев превышают табличные, то связь между признаками считается достоверной и уравнение регрессии существенным.

Оценку значимости коэффициентов регрессии проводят с помощью t-критерия, который рассчитывают по формуле:

.

Ее применяют для шагового регрессионного анализа, при котором на каж­дом шагу поочередно отсеиваются факторы, имеющие незна­чимый коэффициент регрессии. При этом вначале выбираются те факторы, которые имеют наименьшее фактическое значе­ние t-критерия.

Рассмотрим методику корреляционного анализа для мно­жественной корреляции.

Пример. Для анализа удоя коров по 26 хозяйствам было отобрано пять факторов, которые могут оказы­вать влияние на удой: расход кормов на голову, удой матерей, живая масса, продолжительность сухостойного периода и сервис-периода (табл. 7.5).

 


Т а б л и ц а 7.5

Предыдущая статья:Суточный удой молока и возраст коров Следующая статья:Удой коров и факторы, оказывающие на него влияние
page speed (0.2543 sec, direct)