Ро Спирмена - это непараметрическая мера зависимости, в которой вычисляется средняя иерархия наблюдений, разности возводятся в квадрат и включаются в формулу.
Другими словами, мы присваиваем рейтинг наблюдениям каждой переменной и изучаем отношения зависимости между двумя заданными переменными.
Классифицированные корреляции - это непараметрическая альтернатива как мера зависимости между двумя переменными, когда мы не можем применить коэффициент корреляции Пирсона.
Обычно назначается буква гига ро коэффициенту корреляции.
Оценка Ро Спирмена дается по формуле:
Процедура Ро Спирмена
0. Начнем с образца п наблюдения (Aя, Bя).
1. Классифицируйте наблюдения каждой переменной, корректируя их на связи.
- Мы используем функцию Excel, которая классифицирует наблюдения за нас и автоматически корректирует их, если обнаруживает связи между элементами. Эта функция называется HERARCH.MEDIA (классификация Aя; Классификацияп;заказывать).
- Последний фактор функции является необязательным и сообщает нам, в каком порядке мы хотим упорядочить наблюдения. Ненулевое число отсортирует наблюдения в порядке возрастания. Например, наименьшему элементу будет присвоен ранг 1. Если мы поставим ноль в переменную заказывать, присвоит самому большому элементу ранг 1 (в порядке убывания).
Практический пример
- В нашем случае мы присваиваем переменной порядка ненулевое число, чтобы упорядочить наблюдения в порядке возрастания. То есть присвоение наименьшему элементу переменной ранга 1.
- Проверяем, что общие суммы столбцов Классификация А Y Классификация B они равны друг другу и встречаются:
В этом случае n = 10, потому что у нас есть всего 10 элементов / наблюдений в каждой переменной. К Y B.
Общая сумма Классификации A равна общей сумме Классификации Y, и они также соответствуют приведенной выше формуле.
К | B | Классификация А | Классификация B | Квадратные различия |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Общее | 55 | 55 | 130 |
2. Сложите различия между рейтингами и возведите их в квадрат.
- Когда у нас есть все засекреченные наблюдения с учетом связи между ними, мы вычисляем разницу в форме:
dя = Ая - Вя
Определим (dя) как различие между классификацией Aя и классификация Bя.
- Как только разница получена, мы возводим ее в квадрат. Квадраты разностей применяются, чтобы иметь только положительные значения.
Определим dя2 как квадрат разности между классификацией Aя и классификация Bя.
В столбце квадратов разностей будет:
dя2 = (Aя - Вя)2
3. Рассчитайте ро Спирмена:
- Вычисляем общую сумму квадратов разностей формы:
В нашем примере:
- Мы включаем результат в формулу ро Спирмена:
В нашем примере:
Сравнение: Пирсон против Спирмена
Если мы вычислим коэффициент корреляции Пирсона с учетом предыдущих наблюдений и сравним его с коэффициентом корреляции Спирмена, мы получим:
- Пирсон = 0,1109
- Копьеносец = 0,2121
Мы видим, что зависимость между переменными A и B остается слабой даже при использовании Спирмена вместо Пирсона.
Если бы выбросы имели большое влияние на результаты, мы бы обнаружили большую разницу между Пирсоном и Спирменом, и поэтому мы должны использовать Спирмена в качестве меры зависимости.