Коробчатая диаграмма - Что это такое, определение и концепция

Коробчатая диаграмма, от английского, boxplot, - это представление количественной или категориальной переменной с целью быстрого определения квартилей набора данных.

Другими словами, коробчатая диаграмма - это график, который представляет количественную или качественную переменную через квартили.

В статистике это полезный инструмент для представления как дискретных, так и непрерывных наборов данных.

Важно помнить, что качественные переменные, переменные, которые предназначены для представления порядка или категории, всегда должны быть связаны с числовым индексом больше 0, чтобы они могли отображаться на графике и можно было рассчитать соответствующую статистику.

Коробчатая диаграмма и гистограмма

Коробчатая диаграмма - это не что иное, как гистограмма, просматриваемая сверху, и точно так же гистограмма - это коробчатая диаграмма, просматриваемая сбоку. Пример можно увидеть ниже.

Первая характеристика, которую разделяют обе диаграммы, - это минимум и максимум набора данных. Конечные столбцы после тире обозначают минимум (нижний столбец) и максимум (верхний столбец). Выбросы будут представлены вне диапазона максимума и минимума. То есть за чертой после дефиса. Мы также можем найти горизонтальные ящичные диаграммы.

С первого взгляда вы можете увидеть, что большая часть данных сосредоточена на наблюдениях около минимума на обоих графиках. На это указывает прямоугольная диаграмма, на которой прямоугольник ближе к минимуму, чем к максимуму. Если мы посмотрим на гистограмму, мы увидим, что наиболее частые наблюдения - это наблюдения, близкие к минимуму и далекие от максимума.

Информация о коробчатом графике

Информация, представленная коробчатым графиком, выглядит следующим образом:

  1. Нижняя граница поля - это первый квартиль (Q1).
  2. Полоса в середине прямоугольника - это медиана или второй квартиль (Q2).
  3. Верхняя часть прямоугольника - это третий квартиль (Q3).
  4. Межквартильный диапазон или IQR будет высотой прямоугольника, то есть разницей между Q3 и Q1.

Ключ блочной диаграммы

Это графическое представление называется коробчатой ​​диаграммой, потому что оно выглядит как прямоугольник. Следовательно, чтобы запомнить этот график, нам нужно будет думать только о квадратном объекте или прямоугольнике.

Для читателей, знакомых с ценой на финансовые активы, они увидят большее сходство со свечой. Свечи, которые вы видите в котировке, представляют собой коробчатые графики, адаптированные к выбранному временному окну.

Достоинства и недостатки коробчатого сюжета

Среди преимуществ и недостатков этой схемы мы находим следующие:

Преимущество

  • Глобализированное видение абсолютной частоты количественной или качественной переменной.
  • Знание минимума, максимума и квартилей набора данных без необходимости их вычисления.
  • Распознавание экстремальных значений быстрее, чем с помощью гистограммы, потому что экстремальные значения обозначены кружками за пределами максимума и минимума.

Недостатки

  • Если набор данных невелик, создание прямоугольной диаграммы для выражения этих данных затруднит понимание.

Пример коробчатой ​​диаграммы

Мы предполагаем, что хотим представить количество велосипедистов, проезжающих мимо нашего дома в течение года. Сначала мы подсчитываем велосипедистов и собираем информацию в таблицу.

С помощью некоторых программ, таких как R или Excel, мы можем создать график, показанный ниже.

Благодаря представлению количества велосипедистов в виде прямоугольной диаграммы мы можем быстро интуитивно понять, где находится медиана, другие квартили, максимум и минимум. В этом случае у нас нет нетипичных данных, так как за пределами максимума и минимума нет ничего.

Графики этого типа применяются очень часто, учитывая их простоту и полезность во многих областях, помимо финансов и экономики.

Популярные посты

Свет и тени здравоохранения в Соединенных Штатах: за пределами Трампа и Obamacare

Отказ сената США отменить Obamacare подрывает реформу Трампа и гарантирует преемственность действующего закона. Однако это также может быть упущенная возможность улучшить самую дорогую в мире систему здравоохранения, которая не гарантирует охват миллионов пациентов, но является лидером медицинских инноваций.…

Футбольные команды с самым высоким доходом

Результаты списка, подготовленного консалтинговой фирмой Deloitte, показывают доходы 30 самых богатых футбольных команд мира. Сумма выручки 20 команд за последний сезон увеличилась на 8% до 5 400 миллионов евро. Реал Мадрид снова стал первым в списке Подробнее…

Ричард Талер удостоен Нобелевской премии по экономике

В возрасте 72 лет американец Ричард Х. Талер был удостоен Нобелевской премии по экономике. Причина такого различия - его вклад в поведенческую экономику. Другими словами, Талер включил психологию в изучение экономики. Американский экономист Ричард Х. Талер родился в Нью-Йорке.…

Нейроэкономика проникает в сознание рынка

После нескольких лет экономического роста и экспансии во многих частях мира лопнул огромный жилищный и финансовый пузырь, вызвав один из величайших экономических и финансовых кризисов всех времен. Интересно, когда все пошло не так? Десятки книг и тысячи статей были написаны с объяснением Подробнее…