Тау Кендалла (II) - Что это такое, определение и концепция

Содержание:

Anonim

Это непараметрическая мера зависимости, которая определяет согласованные и несогласованные пары двух переменных. После определения итоговые суммы рассчитываются и делается частное.

Другими словами, мы присваиваем рейтинг наблюдениям каждой переменной и изучаем отношения зависимости между двумя заданными переменными.

Есть два способа вычислить Тау Кендалла; мы выбираем вычисление отношения зависимости после того, как будут упорядочены наблюдения каждой переменной. В нашем примере мы увидим, что мы сортируем рейтинги в столбце X в порядке возрастания.

Классифицированные корреляции - это непараметрическая альтернатива как мера зависимости между двумя переменными, когда мы не можем применить коэффициент корреляции Пирсона.

Вот результаты, на которые мы ссылались в первой статье -> Тау Кендалла (I):

Лыжный курорт (я) Икс Z C NC
К 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
А ТАКЖЕ 5 7 4 1
F 6 6 4 1
грамм 7 5 43 3 ОБЩЕЕ
  • Пара BC-CB - дискордантная пара. Мы вводим 1 в столбец NC и фиксируем счетчик в последней позиции, пока снова не найдем подходящую пару. В этом случае мы заморозили количество совпадающих пар с 5 до станции D. Станция D может образовывать только 4 совпадающие пары: AD-DA, DE-ED, DF-FD, DG-GD.

Другой диссонирующей парой будет EF-FE:

  • Пара EF-FE - это дискордантная пара. Записываем 1 в столбец NC и продолжаем перетаскивать число 4 совпадающих пар, которые могут быть образованы. Соответствующие пары станции E будут: EA-AE, EB-BE, EC-CE, ED-DE, потому что EF-FE не согласуется.
    • Пара FG-GF - дискордантная пара. Записываем 1 в столбец NC и продолжаем перетаскивать число 4 совпадающих пар, которые могут быть образованы. Согласные пары станции F s (мы не меняли вместо 4. Согласованные пары, которые мы могли показать раньше (мы не меняли, будут: FA-AF, FB-BF, FC-CF, FD-DF) потому что FG-GF раздражает.

Вычисляем Тау Кендалла

У Тау Кендалла нет никакого секрета, кроме того, что он представляет собой частное совпадение и несогласие пар выборки наблюдений.

Интерпретация

Наш первоначальный вопрос был таков: существует ли зависимость между предпочтениями горнолыжников и лыжников-лыжников на данных горнолыжных курортах?

В этом случае у нас есть зависимость между двумя переменными 0,8695. Результат очень близок к верхнему пределу. Этот результат говорит нам, что горнолыжники (X) и лыжники (Z) классифицировали курорты схожей классификацией.

Без необходимости выполнять какие-либо вычисления, мы можем видеть, что первые станции (A, B, C) получают лучшие результаты из двух групп. Другими словами, рейтинги лыжников идут в том же направлении.

Сравнение: Пирсон vs Кендалл

Если мы вычислим коэффициент корреляции Пирсона с учетом предыдущих наблюдений и сравним его с Тау Кендалла, мы получим:

В этом случае Тау Кендалла говорит нам, что существует более сильная зависимость между переменными X и Z по сравнению с коэффициентом корреляции Пирсона: 0,8695> 0,75.

Если бы выбросы имели большое влияние на результаты, мы бы обнаружили большую разницу между Пирсоном и Спирменом, и поэтому мы должны использовать Спирмена в качестве меры зависимости.