Коробчатая диаграмма - Что это такое, определение и концепция

Содержание:

Коробчатая диаграмма - Что это такое, определение и концепция
Коробчатая диаграмма - Что это такое, определение и концепция
Anonim

Коробчатая диаграмма, от английского, boxplot, - это представление количественной или категориальной переменной с целью быстрого определения квартилей набора данных.

Другими словами, коробчатая диаграмма - это график, который представляет количественную или качественную переменную через квартили.

В статистике это полезный инструмент для представления как дискретных, так и непрерывных наборов данных.

Важно помнить, что качественные переменные, переменные, которые предназначены для представления порядка или категории, всегда должны быть связаны с числовым индексом больше 0, чтобы они могли отображаться на графике и можно было рассчитать соответствующую статистику.

Коробчатая диаграмма и гистограмма

Коробчатая диаграмма - это не что иное, как гистограмма, просматриваемая сверху, и точно так же гистограмма - это коробчатая диаграмма, просматриваемая сбоку. Пример можно увидеть ниже.

Первая характеристика, которую разделяют обе диаграммы, - это минимум и максимум набора данных. Конечные столбцы после тире обозначают минимум (нижний столбец) и максимум (верхний столбец). Выбросы будут представлены вне диапазона максимума и минимума. То есть за чертой после дефиса. Мы также можем найти горизонтальные ящичные диаграммы.

С первого взгляда вы можете увидеть, что большая часть данных сосредоточена на наблюдениях около минимума на обоих графиках. На это указывает прямоугольная диаграмма, на которой прямоугольник ближе к минимуму, чем к максимуму. Если мы посмотрим на гистограмму, мы увидим, что наиболее частые наблюдения - это наблюдения, близкие к минимуму и далекие от максимума.

Информация о коробчатом графике

Информация, представленная коробчатым графиком, выглядит следующим образом:

  1. Нижняя граница поля - это первый квартиль (Q1).
  2. Полоса в середине прямоугольника - это медиана или второй квартиль (Q2).
  3. Верхняя часть прямоугольника - это третий квартиль (Q3).
  4. Межквартильный диапазон или IQR будет высотой прямоугольника, то есть разницей между Q3 и Q1.

Ключ блочной диаграммы

Это графическое представление называется коробчатой ​​диаграммой, потому что оно выглядит как прямоугольник. Следовательно, чтобы запомнить этот график, нам нужно будет думать только о квадратном объекте или прямоугольнике.

Для читателей, знакомых с ценой на финансовые активы, они увидят большее сходство со свечой. Свечи, которые вы видите в котировке, представляют собой коробчатые графики, адаптированные к выбранному временному окну.

Достоинства и недостатки коробчатого сюжета

Среди преимуществ и недостатков этой схемы мы находим следующие:

Преимущество

  • Глобализированное видение абсолютной частоты количественной или качественной переменной.
  • Знание минимума, максимума и квартилей набора данных без необходимости их вычисления.
  • Распознавание экстремальных значений быстрее, чем с помощью гистограммы, потому что экстремальные значения обозначены кружками за пределами максимума и минимума.

Недостатки

  • Если набор данных невелик, создание прямоугольной диаграммы для выражения этих данных затруднит понимание.

Пример коробчатой ​​диаграммы

Мы предполагаем, что хотим представить количество велосипедистов, проезжающих мимо нашего дома в течение года. Сначала мы подсчитываем велосипедистов и собираем информацию в таблицу.

С помощью некоторых программ, таких как R или Excel, мы можем создать график, показанный ниже.

Благодаря представлению количества велосипедистов в виде прямоугольной диаграммы мы можем быстро интуитивно понять, где находится медиана, другие квартили, максимум и минимум. В этом случае у нас нет нетипичных данных, так как за пределами максимума и минимума нет ничего.

Графики этого типа применяются очень часто, учитывая их простоту и полезность во многих областях, помимо финансов и экономики.