Квартильное отклонение - что это такое, определение и понятие

Содержание:

Квартильное отклонение - что это такое, определение и понятие
Квартильное отклонение - что это такое, определение и понятие
Anonim

Квартильное отклонение - это статистическая мера дисперсии, которая возвращает центральное значение межквартильного размаха и используется в асимметричных наборах данных.

Другими словами, квартильное отклонение предназначено для расчета медианы межквартильного диапазона (IQR) и используется в наборах данных с довольно большим количеством экстремальных значений.

Сокращение для квартильного отклонения - DQ.

Межквартильный размах

Межквартильный размах - это мера разброса набора данных, обычно используемого в прямоугольной диаграмме. Другими словами, межквартильный размах - это разница между предпоследним и первым квартилями распределения, используемого в ящичной диаграмме.

IQR = Q3 - Q1

Преимущество использования межквартильного размаха состоит в том, что можно рассчитать квартильное отклонение (DQ), которое является очень адекватной мерой дисперсии, когда мы имеем смещенные наборы данных.

Формула квартирного отклонения

Квартильное отклонение рассчитывается как деление межквартильного размаха на 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Поскольку мы учитываем только дисперсию между третьим и первым квартилями, мы игнорируем все данные за пределами этого диапазона. И поэтому все значения близки к экстремальным. Итак, если мы разделим межквартильный размах на два, мы получим медианное значение дисперсии.

Пример квартирного отклонения

Мы предполагаем, что мы хотим вычислить межквартильный размах и квартальное отклонение количества велосипедистов, проезжающих мимо нашего дома в течение года.

  1. Сначала мы подсчитываем велосипедистов и собираем информацию в таблицу.
  1. Во-вторых, мы вычисляем первый и третий квартили, чтобы получить межквартильный размах.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. В-третьих, мы вычисляем квартирную дисперсию, просто разделив межквартильный размах на два.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Квартильный разброс для этого набора данных составляет 175. Это число является центральным значением межквартильного размаха.

Важно отметить, что данные за июль являются экстремальными данными, поскольку они в несколько раз выше, чем все остальные данные. Таким образом, мы можем сказать, что этот набор данных смещен в сторону этого месяца. Из-за «незнания» квартильного разброса по отношению к экстремальным данным результат этой меры очень похож на то, если бы в июле было всего 600 велосипедистов. Если бы в июле было всего 600 велосипедистов, квартильный разброс составил бы 162,5, что очень близко к 175, учитывая, что количество велосипедистов в этом месяце в 10 раз меньше.