Коробчатая диаграмма, от английского, boxplot, - это представление количественной или категориальной переменной с целью быстрого определения квартилей набора данных.
Другими словами, коробчатая диаграмма - это график, который представляет количественную или качественную переменную через квартили.
В статистике это полезный инструмент для представления как дискретных, так и непрерывных наборов данных.
Важно помнить, что качественные переменные, переменные, которые предназначены для представления порядка или категории, всегда должны быть связаны с числовым индексом больше 0, чтобы они могли отображаться на графике и можно было рассчитать соответствующую статистику.
Коробчатая диаграмма и гистограмма
Коробчатая диаграмма - это не что иное, как гистограмма, просматриваемая сверху, и точно так же гистограмма - это коробчатая диаграмма, просматриваемая сбоку. Пример можно увидеть ниже.
Первая характеристика, которую разделяют обе диаграммы, - это минимум и максимум набора данных. Конечные столбцы после тире обозначают минимум (нижний столбец) и максимум (верхний столбец). Выбросы будут представлены вне диапазона максимума и минимума. То есть за чертой после дефиса. Мы также можем найти горизонтальные ящичные диаграммы.
С первого взгляда вы можете увидеть, что большая часть данных сосредоточена на наблюдениях около минимума на обоих графиках. На это указывает прямоугольная диаграмма, на которой прямоугольник ближе к минимуму, чем к максимуму. Если мы посмотрим на гистограмму, мы увидим, что наиболее частые наблюдения - это наблюдения, близкие к минимуму и далекие от максимума.
Информация о коробчатом графике
Информация, представленная коробчатым графиком, выглядит следующим образом:
- Нижняя граница поля - это первый квартиль (Q1).
- Полоса в середине прямоугольника - это медиана или второй квартиль (Q2).
- Верхняя часть прямоугольника - это третий квартиль (Q3).
- Межквартильный диапазон или IQR будет высотой прямоугольника, то есть разницей между Q3 и Q1.
Ключ блочной диаграммы
Это графическое представление называется коробчатой диаграммой, потому что оно выглядит как прямоугольник. Следовательно, чтобы запомнить этот график, нам нужно будет думать только о квадратном объекте или прямоугольнике.
Для читателей, знакомых с ценой на финансовые активы, они увидят большее сходство со свечой. Свечи, которые вы видите в котировке, представляют собой коробчатые графики, адаптированные к выбранному временному окну.
Достоинства и недостатки коробчатого сюжета
Среди преимуществ и недостатков этой схемы мы находим следующие:
Преимущество
- Глобализированное видение абсолютной частоты количественной или качественной переменной.
- Знание минимума, максимума и квартилей набора данных без необходимости их вычисления.
- Распознавание экстремальных значений быстрее, чем с помощью гистограммы, потому что экстремальные значения обозначены кружками за пределами максимума и минимума.
Недостатки
- Если набор данных невелик, создание прямоугольной диаграммы для выражения этих данных затруднит понимание.
Пример коробчатой диаграммы
Мы предполагаем, что хотим представить количество велосипедистов, проезжающих мимо нашего дома в течение года. Сначала мы подсчитываем велосипедистов и собираем информацию в таблицу.
С помощью некоторых программ, таких как R или Excel, мы можем создать график, показанный ниже.
Благодаря представлению количества велосипедистов в виде прямоугольной диаграммы мы можем быстро интуитивно понять, где находится медиана, другие квартили, максимум и минимум. В этом случае у нас нет нетипичных данных, так как за пределами максимума и минимума нет ничего.
Графики этого типа применяются очень часто, учитывая их простоту и полезность во многих областях, помимо финансов и экономики.