МЕТОД КАНОНИЧЕСКИХ КОРРЕЛЯЦИЙ

№58-1,

Физико-математические науки

Метод канонических корреляций является обобщением парной корреляции и позволяет находить максимальные корреляционные связи между двумя группами случайных величин.

Похожие материалы

Метод канонических корреляций является обобщением парной корреляции и позволяет находить максимальные корреляционные связи между двумя группами случайных величин. Эта зависимость определяется при помощи новых аргументов - канонических величин (канонических переменных), вычисленных как линейные комбинации исходных признаков по каждой из групп. Эти канонические величины должны максимально коррелировать между собой, а их число определяется по числу переменных в меньшем множестве (если число переменных в них не одинаково).

Например, эффективность работы предприятий оценивается такими показателями как производительность труда, фондоотдача основных фондов, прибыль, рентабельность и другими. Факторами, влияющими на показатели, являются численность работающих, стоимость основных фондов, оборачиваемость оборотных средств, удельный вес потерь от брака, трудоемкость единицы продукции, коэффициент сменности работы оборудования и тому подобные. Метод канонических корреляций позволяет анализировать взаимосвязь нескольких выходных показателей и большого числа определяющих факторов.

Пусть имеется k-мерный случайный вектор X. Не умаляя общности можем предположить, что математическое ожидание вектора равно нулю, дисперсии компонент равны единице, корреляционная матрица R положительно определена. Вектор X разбивается на два подвектора X1 и X2 размерности m и p соответственно. При этом m+p=k и m≤p. Подвекторы образуют две группы показателей. Задача заключается в выявлении максимальных связей между этими группами. Для этого вводят новые переменные (канонические переменные) d11 и d12 .

d11=a1*x11+a2*x21+...ai*xi1+...+am*xm1

d12=b1*x12+b2*x22+...bj*xj2+...+bp*xp2

где d11 и d12 - первая пара канонических переменных; xi1 - i-я компонента подвектора X1; xj2-j-я компонента подвектора X2 ; ai и bj – коэффициенты; i=1,...,m; j=1,..., p.

Корреляция между d11 и d12 должна быть максимальной среди всех других возможных линейных комбинаций (канонических переменных). Далее в каждой группе рассматриваются следующие линейные комбинации d21 и d22, у которых корреляция больше, чем между любыми другими линейными комбинациями, не коррелированными с первыми линейными комбинациями. Затем по аналогии пары d31 и d32, d41 и d42 и т.д. В общем случае должно быть m корреляций между каноническими переменными, которые не коррелируют с другими.

Общая корреляционная матрица Xт*X вектора X может быть представлена совокупностью подматриц.

Далее определяется матрица B размером m*m:

B=R-111*R12*R-122*R21.

Собственные значения этой матрицы, ранжированные по убыванию, равняются квадратам коэффициентов канонических корреляций. Для разрешимости задачи необходимо, чтобы корреляционные матрицы R11 и R22 были положительно определены. Это означает, что в составе X1 и X2 не должны существовать линейно зависимые компоненты. В противном случае следует один или несколько показателей-факторов исключить.

Канонические переменные обладают следующими свойствами:

  1. Канонические переменные являются линейными комбинациями исходных показателей соответствующих групп.
  2. Канонические переменные одной группы взаимно не коррелированны.
  3. Канонические переменные выбраны таким образом, чтобы соответствующие канонические корреляции были максимальны.
  4. Канонические переменные упорядочены по мере убывания соответствующих канонических корреляций.
  5. Число используемых канонических корреляций не превосходит число исследуемых показателей m≤p.

Канонические корреляции всегда неотрицательны. Чем больше значения канонических корреляций тем сильнее связаны группы признаков X1 и X2 показателей.

Значимость канонических корреляций проверяется с использованием критерия Пирсона χ2. Если вычислено m канонических корреляций ρ1, ρ2,..., ρ1m, то необходимо проверить m нулевых гипотез:

H0j: ρj=0, j=1, ...,m.

При этом, необходимо учитывать, канонические корреляции упорядочены по величине ρmm-1>...>ρ1.

При проверке гипотез статистика χ2 вычисляется по формуле:

χj2=[n-j-0,5*(k+1)+∑(rf)2]*ln{Π[1- (rl)2]},

где n - объем выборки; k - размерность вектора X=(X1,X2)т; rf – оценка f-го коэффициента канонической корреляции (f=1,...,j-1); rl – оценка l-го коэффициента канонической корреляции (f=1,...,m); число степеней свободы статистики: ν=[(p-j+1)*(m-j+1)].

Если значение статистики превосходит критическое значение при заданном уровне значимости α, или p-Value не превосходит α, то данные противоречат гипотезе и ρj отлично от нуля. Так как значения канонических корреляций упорядочены, при ρj=0, то и остальные m – j значений канонических корреляций равны нулю.

Список литературы

  1. Аблеева, А. М. Формирование фонда оценочных средств в условиях ФГОС [Текст] / А. М. Аблеева, Г. А. Салимова // Актуальные проблемы преподавания социально-гуманитарных, естественно - научных и технических дисциплин в условиях модернизации высшей школы : материалы международной научно-методической конференции, 4-5 апреля 2014 г. / Башкирский ГАУ, Факультет информационных технологий и управления. - Уфа, 2014. - С. 11-14.
  2. Ганиева, А.М. Статистический анализ занятости и безработицы [Текст] / А.М. Ганиева, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры "Статистики и информационных систем в экономике" / Башкирский ГАУ. - Уфа, 2011. - С. 315-316.
  3. Исламгулов, Д.Р. Компетентностный подход в обучении: оценка качества образования [Текст] / Д.Р. Исламгулов, Т.Н. Лубова, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. - № 1. – С. 62-69.
  4. Исламгулов, Д. Р. Научно-исследовательская работа студентов - важнейший элемент подготовки специалистов в аграрном вузе [Текст] / Д. Р. Исламгулов // Проблемы практической подготовки студентов в вузе на современном этапе и пути их решения : сб. материалов науч.-метод. конф., 24 апреля 2007 года / Башкирский ГАУ. - Уфа, 2007. - С. 20-22.
  5. Лубова, Т.Н. Новые образовательные стандарты: особенности реализации [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Современный научный вестник. – 2015. – Т. 7. - № 1. – С. 79-84.
  6. Лубова, Т.Н. Организация самостоятельной работы обучающихся [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Реализация образовательных программ высшего образования в рамках ФГОС ВО: материалы Всероссийской научно-методической конференции в рамках выездного совещания НМС по природообустройству и водопользованию Федерального УМО в системе ВО. / Башкирский ГАУ. - Уфа, 2016. - С. 214-219.
  7. Лубова, Т.Н. Основа реализации федерального государственного образовательного стандарта – компетентностный подход [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. - № 1. – С. 85-93.
  8. Саубанова, Л.М. Уровень демографической нагрузки [Текст] / Л.М. Саубанова, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры "Статистики и информационных систем в экономике" / Башкирский ГАУ. - Уфа, 2011. - С. 321-322.
  9. Фахруллина, А.Р. Статистический анализ инфляции в России [Текст] / А.Р. Фахруллина, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры "Статистики и информационных систем в экономике" / Башкирский ГАУ. - Уфа, 2011. - С. 323-324.