Квантиль - это точка, которая делит функцию распределения случайной величины на регулярные интервалы..
Следовательно, это не более чем статистический метод отделения данных от распределения. Конечно, необходимо, чтобы группы были равны. По этой причине существуют разные типы квантилей, как мы увидим позже, в зависимости от количества делимых ими разделов.
Они чрезвычайно полезны во многих практических приложениях, мы покажем одно из них.
Форма расчета квантилей
Квантили можно рассчитать с параметрической и непараметрической точки зрения. Давайте рассмотрим как более подробно, так и так называемую «квантильную функцию».
- Параметрический: Они используются в дистрибутивах, форма которых нам известна. То есть распределение будет нормальным, равномерным, экспоненциальным и так далее. Таким образом, предполагается, что он известен, а также его основные параметры (среднее арифметическое и дисперсия).
- Непараметрический: Он подходит для небольших образцов, где трудно узнать его точную форму, и поэтому мы не знаем его функцию распределения. Этот метод обеспечивает значения, аналогичные предыдущему при увеличении выборки, и, следовательно, использование обоих безразлично.
- Квантильная функция: Перед нами вероятностная форма расчета. Цель состоит в том, чтобы вычислить значение, которое имеет определенную вероятность в функции распределения. Мы не будем вдаваться в математические вопросы, усложняющие концепцию.
Наиболее частые квантили
Мы собираемся показать, какие квантили чаще всего используются в статистике. Большинство из них обычно используются для детального анализа распределения данных. Кроме того, еще одно его использование - разделение данных на группы с возможностью выбора самого высокого или самого низкого. В примере мы увидим это более подробно.
- Квартиль: Разделите значения на четыре равные группы и получите три квартиля. Это самый частый. Первый квартиль (Q1) - самые низкие данные, а третий квартиль (Q3) - самые высокие. С другой стороны, второй квартиль (Q2) соответствует медиане (Me), которая представляет собой статистику положения, которая делит распределение данных пополам. Значения квантилей будут 0,25 (Q1), 0,5 (Q2) и 0,75 (Q3).
- Квинтиль: Подобно предыдущему, он выполняется реже и делит данные на пять равных частей. Таким образом, есть четыре квинтиля. Значения квантилей в этом случае будут 0,20, 0,40, 0,60, 0,80.
- Дециль: В этом случае они разделены на десять частей и, следовательно, есть девять децилей. Опять же, это тоже не так уж часто. Их значения будут от 0,1 до 0,9.
- Процентили: Перед нами вариант, при котором раздача делится на сто равных частей. Это может быть интересно для очень больших выборок. Их значения варьируются от 0,01 до 0,99.
Квантильный пример
Давайте рассмотрим пример, в котором у нас есть ряд данных о доходах жителей определенного муниципального образования. Мы рассчитали три наиболее репрезентативных квартиля и три дециля. Мы включаем использованные формулы с учетом того, что для децилей мы используем эквивалент в процентилях. Помните, что данные в Q2 и D5 эквивалентны медиане.
Мы можем наблюдать, что доход лиц, представляющих 25% наименее привилегированных (первый квартал), составляет 2 900 человек. По отношению к децилю доход 10% (D1) лиц, получающих меньше всего, составляет 2800. То же самое и с начальством, но наоборот. 25% (третий квартал), которые зарабатывают больше всего, получают доход в размере 4100, а 10% - в размере 4800. Таким образом, квантиль отражает релевантную информацию, позволяющую узнать больше о переменной.