распределения переменных. Простая формула для вычисления коэффициента корреляции произведения
моментов Пирсона по «сырым» (нестандартизованным) данным выглядит следующим образом:
y
x
XY
N
XY
r
/
)
(
.
Бисериальная корреляция
Разновидностью коэффициента корреляции произведения моментов яв-ся бисериальный
коэффициент корреляции, тж разраб. Пирсоном. В тех случаях, когда только одна из переменных
непрерывна и имеет приемлемо нормальное распределение, а др. искусственно дихотомизирована
(предполагается, что она тоже непрерывна и нормально распределена, но представлена в бинарной
форме, напр.: «справился/не справился»), связь между этими двумя переменными тж можно выразить
при помощи r. В этом случае коэффициент корреляции обозначается через r
bis
.
Как и коэффициент
произведения моментов r, он изменяется в диапазоне от +1,00 (прямая функциональная связь) через 0,00
(отсутствие связи) до -1,00 (обратная функциональная связь). Метод бисериальной корреляции оказался
весьма полезным в процедурах анализа заданий, т. к. он измеряет связь между рез-тами выполнения
каждого задания теста, выраженными в бинарной форме («справился/не справился»), и общей оценкой
по данному тесту.
Точечно-бисериальная корреляция
Последующая модификация коэффициента корреляции произведения моментов получила
отражение в точечно бисериальном r. Эта стат. показывает связь между двумя переменными, одна из к-
рых предположительно непрерывна и нормально распределена, а др. яв-ся дискретной в точном смысле
слова. Точечно-бисериальный коэффициент корреляции обозначается через r
pbis
Поскольку в r
pbis
дихотомия отражает подлинную природу дискретной переменной, а не яв-ся искусственной, как в
случае r
bis
, его знак определяется произвольно. Поэтому для всех практ. целей r
pbis
рассматривается в
диапазоне от 0,00 до +1,00.
Существует и такой случай, когда две переменные считаются непрерывными и нормально
распределенными, но обе искусственно дихотомизированы, как в случае бисериальной корреляции. Для
оценки связи между такими переменными применяется тетрахорический коэффициент корреляции r
tet
,
к-рый был тж выведен Пирсоном. Осн. (точные) формулы и процедуры для вычисления r
tet
достаточно
сложны. Поэтому при практ. применении этого метода используются приближения r
tet
,
получаемые на
основе сокращенных процедур и таблиц.
Ранговая корреляция
Непараметрический аналог параметрических методов корреляции существует в форме
коэффициента ранговой корреляции, обозначаемого греческой буквой ?(ро). Он применяется для
определения степени связи между двумя переменными, значения к-рых представлены рангами, а не
«сырыми» или стандартизованными оценками. Логическое обоснование вывода коэффициента ?
не
требует соблюдения строго определенного набора допущений, и потому ? является непараметрической
стат. Его формула, получаемая из формулы произведения моментов Пирсона путем замены
интервальных данных на ранжированные, приводится к виду:
?
= 1 - (6?d²) / N(N² - 1), где d ранговая разность, а N число пар вариантов.
Множественная корреляция
Методы корреляции произведения моментов Пирсона и линейного регрессионного анализа
Гальтона были обобщены и расширены в 1897 г. Джорджем Эдни Юлом до модели множественной
линейной регрессии, предполагающей использование многомерного нормального распределения.
Методы множественной корреляции позволяют оценить связь между множеством непрерывных
независимых переменных и одной зависимой непрерывной переменной. Коэффициент множественной
корреляции обозначается через R
0.123...p
Его вычисление требует решения совместной системы линейных
уравнений. Число линейных уравнений равно числу независимых переменных.
Иногда необходимо исключить эффект третьей переменной, с тем чтобы определить «чистую»
связь между любой парой переменных. Частный (парциальный) коэффициент корреляции выражает
связь между двумя переменными при исключенном (элиминированном) влиянии еще одной или неск.
др. переменных. В простейшем случае частный коэффициент корреляции вычисляется как функция
парных корреляций (произведений моментов) между Y, X1 и Х2:
2
12
2
2
12
2
1
2
.
1
1
1
r
r
r
r
r
r
y
y
y
y
.
Если требуется исключить влияние двух переменных, скажем, Х2
и Х3, то формула принимает
|