, определяющая соответствие между парой значений случайных величин (xi, yj) и относительной частотой появления этой комбинации в выборке nij, при этом:
— объем выборки;
— относительная частота появления yj;
— относительная частота появления xi.Определение. Выборочным корреляционным моментом двумерной случайной величины
(X, Y) называется
.Определение. Выборочным коэффициентом корреляции двумерной случайной величины
(X, Y) называется
.Замечание. Удобство введения выборочного коэффициента корреляции наряду с корреляционным моментом связано с тем, что коэффициент корреляции — величина безразмерная, и не зависит от выбора системы единиц измерения X и Y.Теорема. Выборочный корреляционный момент может быть посчитан как:
.Доказательство. Аналогично соответствующей теореме в кванте 45.Пусть сделана выборка объема n и вычислен выборочный коэффициент корреляции
. Разумеется, выборочный коэффициент корреляции
вовсе не равен генеральному коэффициенту корреляции
, а представляет всего лишь его оценку. Таким образом, ставится статистическая задача: проверить нулевую гипотезу
(гипотеза о равенстве нулю генерального коэффициента корреляции). При этом альтернативная (конкурирующая) гипотеза:
. Для проверки гипотезы задается некоторый уровень значимости α. В качестве критерия для проверки нулевой гипотезы выбирают случайную величину:
.Случайная величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n - 2 степенями свободы. Далее по таблице критических точек распределения Стьюдента (см. ниже), по заданному уровню значимости α и числу степеней свободы k = n - 2 определяют критические точки tкр. Этих критических точек — две, они отличаются знаком, поскольку коэффициент корреляции
, и отличие от нуля может быть как в сторону положительных значений, так и в сторону отрицательных. Если по данным выборки наблюдаемое значение случайной величины
, то нулевую гипотезу принимают (или, более точно, нет оснований ее отвергнуть). Если по данным выборки наблюдаемое значение случайной величины
, то нулевую гипотезу отвергают, а принимают конкурирующую гипотезу.
Таблица критических точек распределения Стьюдента
Степени свободы k |
Уровень значимости α (2-сторонняя критическая область) |
|||
0,1 |
0,05 |
0,02 |
0,01 |
|
1 |
6,31 |
12,7 |
31,82 |
63,7 |
|
0,05 |
0,025 |
0,01 |
0,005 |
Уровень значимости α (1-сторонняя критическая область) |
||||
. При уровне значимости 0,05 проверить гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе
.Наблюдаемое значение критерия равно:
.Как уже упоминалось выше, при конкурирующей гипотезе
критическая область — двусторонняя. При заданных
и
находим:
. Поскольку
, то оснований отвергнуть гипотезу нет, и она принимается.Видеолекция «Основы корреляционного анализа»: