Это непараметрическая мера зависимости, которая определяет согласованные и несогласованные пары двух переменных. После определения итоговые суммы рассчитываются и делается частное.
Другими словами, мы присваиваем рейтинг наблюдениям каждой переменной и изучаем отношения зависимости между двумя заданными переменными.
Есть два способа вычислить Тау Кендалла; мы выбираем вычисление отношения зависимости после того, как будут упорядочены наблюдения каждой переменной. В нашем примере мы увидим, что мы сортируем рейтинги в столбце X в порядке возрастания.
Классифицированные корреляции - это непараметрическая альтернатива как мера зависимости между двумя переменными, когда мы не можем применить коэффициент корреляции Пирсона.
Вот результаты, на которые мы ссылались в первой статье -> Тау Кендалла (I):
Лыжный курорт (я) | Икс | Z | C | NC | |
К | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
А ТАКЖЕ | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
грамм | 7 | 5 | 43 | 3 | ОБЩЕЕ |
- Пара BC-CB - дискордантная пара. Мы вводим 1 в столбец NC и фиксируем счетчик в последней позиции, пока снова не найдем подходящую пару. В этом случае мы заморозили количество совпадающих пар с 5 до станции D. Станция D может образовывать только 4 совпадающие пары: AD-DA, DE-ED, DF-FD, DG-GD.
Другой диссонирующей парой будет EF-FE:
- Пара EF-FE - это дискордантная пара. Записываем 1 в столбец NC и продолжаем перетаскивать число 4 совпадающих пар, которые могут быть образованы. Соответствующие пары станции E будут: EA-AE, EB-BE, EC-CE, ED-DE, потому что EF-FE не согласуется.
- Пара FG-GF - дискордантная пара. Записываем 1 в столбец NC и продолжаем перетаскивать число 4 совпадающих пар, которые могут быть образованы. Согласные пары станции F s (мы не меняли вместо 4. Согласованные пары, которые мы могли показать раньше (мы не меняли, будут: FA-AF, FB-BF, FC-CF, FD-DF) потому что FG-GF раздражает.
Вычисляем Тау Кендалла
У Тау Кендалла нет никакого секрета, кроме того, что он представляет собой частное совпадение и несогласие пар выборки наблюдений.
Интерпретация
Наш первоначальный вопрос был таков: существует ли зависимость между предпочтениями горнолыжников и лыжников-лыжников на данных горнолыжных курортах?
В этом случае у нас есть зависимость между двумя переменными 0,8695. Результат очень близок к верхнему пределу. Этот результат говорит нам, что горнолыжники (X) и лыжники (Z) классифицировали курорты схожей классификацией.
Без необходимости выполнять какие-либо вычисления, мы можем видеть, что первые станции (A, B, C) получают лучшие результаты из двух групп. Другими словами, рейтинги лыжников идут в том же направлении.
Сравнение: Пирсон vs Кендалл
Если мы вычислим коэффициент корреляции Пирсона с учетом предыдущих наблюдений и сравним его с Тау Кендалла, мы получим:
В этом случае Тау Кендалла говорит нам, что существует более сильная зависимость между переменными X и Z по сравнению с коэффициентом корреляции Пирсона: 0,8695> 0,75.
Если бы выбросы имели большое влияние на результаты, мы бы обнаружили большую разницу между Пирсоном и Спирменом, и поэтому мы должны использовать Спирмена в качестве меры зависимости.