Тау Кендалла (I) - Что это такое, определение и концепция

Содержание:

Тау Кендалла (I) - Что это такое, определение и концепция
Тау Кендалла (I) - Что это такое, определение и концепция
Anonim

Это непараметрическая мера зависимости, которая определяет согласованные и несогласованные пары двух переменных. После определения итоговые суммы рассчитываются и делается частное.

Классифицированные корреляции - это непараметрическая альтернатива как мера зависимости между двумя переменными, когда мы не можем применить коэффициент корреляции Пирсона.

Другими словами, мы присваиваем рейтинг наблюдениям каждой переменной и изучаем отношения зависимости между двумя заданными переменными. Есть два способа вычислить Тау Кендалла; мы выбираем вычисление отношения зависимости после того, как будут упорядочены наблюдения каждой переменной. В нашем примере мы увидим, что отсортировали рейтинги в столбце X в порядке возрастания.

Математически,

Мы определяем:

Cп = общее количество совпадающих пар.

NCп = общее количество несовпадающих (несогласованных) пар.

Порядок действий и практический пример

Чтобы получить Тау Кендалла, мы должны сначала узнать, как идентифицировать согласованные и несогласные пары двух переменных.

Воспользуемся предпочтениями лыжников. В этом примере мы предполагаем, что хотим оценить, классифицируют ли лыжники свои предпочтения в отношении горных или лыжных гонок в одном и том же порядке на станции i. Их рейтинг может варьироваться от 1 (очень предпочтительно) до 7 (очень мало предпочтительно).

Наш вопрос: есть ли зависимость между предпочтениями горнолыжников и лыжников на данных горнолыжных курортах?

Мы определяем:

X = рейтинг лыжников по горным лыжам на станции i.

Y = оценка лыжников по лыжным гонкам на станции i.

C = согласованные пары.

NC = несовпадающие / несогласованные пары.

А ТАКЖЕя = горнолыжный курорт i.

Процесс

  • Начнем с образца п = 7 наблюдения за горнолыжным курортом. Каждая строка таблицы - это классификации лыжников. Каждая пара станций может быть согласованной или несогласной. В столбцах C и NC мы считаем пары только в одном направлении. Например, пара AB и BA считается одной парой, чтобы избежать повторений.

Полученные наблюдения:

Лыжный курорт (я) Икс Z
К 1 1
B 2 3
C 3 4
D 4 2
А ТАКЖЕ 5 7
F 6 6
грамм 7 5
  1. Мы отсортировали элементы столбца X в порядке возрастания, чтобы можно было сравнить их с элементами столбца Z
  2. Находим согласованные пары и дискордантные пары.
Лыжный курорт (я) Икс Z CNC
К 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
А ТАКЖЕ 5 7 4 1
F 6 6 4 1
грамм 7 5 43 3 Общее
  • Сначала мы смотрим на столбец Z, поскольку столбец X уже отсортирован в порядке возрастания. Следовательно, все классификации в столбце Z, которые не являются восходящими, будут несогласованными парами станций.
    • Когда мы ищем пары станций (совпадающих и несовпадающих), у нас всегда будет последняя строка наблюдений, потому что мы ищем пары (наборы из двух наблюдений).
    • Все, что ниже эталонной классификации, будут конкордантными парами. В первом случае оба лыжника устанавливают эталонную классификацию на 1. Все классификации ниже 1 будут парными, соответствующими A. Всего у нас есть 7 станций для классификации. Итак, будет 6 согласованных пар A. Поскольку у нас нет дискордантных пар, связанных с A, мы поставим ноль.

Прочтите вторую часть Тау Кендалла (II)