Это непараметрическая мера зависимости, которая определяет согласованные и несогласованные пары двух переменных. После определения итоговые суммы рассчитываются и делается частное.
Классифицированные корреляции - это непараметрическая альтернатива как мера зависимости между двумя переменными, когда мы не можем применить коэффициент корреляции Пирсона.
Другими словами, мы присваиваем рейтинг наблюдениям каждой переменной и изучаем отношения зависимости между двумя заданными переменными. Есть два способа вычислить Тау Кендалла; мы выбираем вычисление отношения зависимости после того, как будут упорядочены наблюдения каждой переменной. В нашем примере мы увидим, что отсортировали рейтинги в столбце X в порядке возрастания.
Математически,
Мы определяем:
Cп = общее количество совпадающих пар.
NCп = общее количество несовпадающих (несогласованных) пар.
Порядок действий и практический пример
Чтобы получить Тау Кендалла, мы должны сначала узнать, как идентифицировать согласованные и несогласные пары двух переменных.
Воспользуемся предпочтениями лыжников. В этом примере мы предполагаем, что хотим оценить, классифицируют ли лыжники свои предпочтения в отношении горных или лыжных гонок в одном и том же порядке на станции i. Их рейтинг может варьироваться от 1 (очень предпочтительно) до 7 (очень мало предпочтительно).
Наш вопрос: есть ли зависимость между предпочтениями горнолыжников и лыжников на данных горнолыжных курортах?
Мы определяем:
X = рейтинг лыжников по горным лыжам на станции i.
Y = оценка лыжников по лыжным гонкам на станции i.
C = согласованные пары.
NC = несовпадающие / несогласованные пары.
А ТАКЖЕя = горнолыжный курорт i.
Процесс
- Начнем с образца п = 7 наблюдения за горнолыжным курортом. Каждая строка таблицы - это классификации лыжников. Каждая пара станций может быть согласованной или несогласной. В столбцах C и NC мы считаем пары только в одном направлении. Например, пара AB и BA считается одной парой, чтобы избежать повторений.
Полученные наблюдения:
Лыжный курорт (я) | Икс | Z |
К | 1 | 1 |
B | 2 | 3 |
C | 3 | 4 |
D | 4 | 2 |
А ТАКЖЕ | 5 | 7 |
F | 6 | 6 |
грамм | 7 | 5 |
- Мы отсортировали элементы столбца X в порядке возрастания, чтобы можно было сравнить их с элементами столбца Z
- Находим согласованные пары и дискордантные пары.
Лыжный курорт (я) | Икс | Z | C | NC | |
К | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
А ТАКЖЕ | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
грамм | 7 | 5 | 43 | 3 | Общее |
- Сначала мы смотрим на столбец Z, поскольку столбец X уже отсортирован в порядке возрастания. Следовательно, все классификации в столбце Z, которые не являются восходящими, будут несогласованными парами станций.
- Когда мы ищем пары станций (совпадающих и несовпадающих), у нас всегда будет последняя строка наблюдений, потому что мы ищем пары (наборы из двух наблюдений).
- Все, что ниже эталонной классификации, будут конкордантными парами. В первом случае оба лыжника устанавливают эталонную классификацию на 1. Все классификации ниже 1 будут парными, соответствующими A. Всего у нас есть 7 станций для классификации. Итак, будет 6 согласованных пар A. Поскольку у нас нет дискордантных пар, связанных с A, мы поставим ноль.
Прочтите вторую часть Тау Кендалла (II)