Процентиль - это статистическая мера положения, делящая упорядоченное распределение данных на сто равных частей.
Эта мера нецентрального положения предоставляет информацию о процентном соотношении наблюдений переменной, упорядоченных от самого низкого до самого высокого, которые ниже ее значения.
Таким образом, 20-й процентиль (P20) будет значением переменной, находящейся на границе первых 20.
Как рассчитывается процентиль?
Как и все квантили, процентиль может быть рассчитан для сгруппированных данных или нет. Для первых есть несколько сложных формул, которые мы можем найти в руководствах по статистике. Для последнего проще всего использовать электронную таблицу.
На изображении мы видим форму представления. Основной прямоугольник представляет данные, упорядоченные от наименьшего к наибольшему, а голубые - различные процентили.
Мы показали три наиболее актуальных. Особенно P50, который соответствует медиане.
Мы также включаем формулу для вашего расчета.
Процентильная характеристика
Давайте посмотрим на некоторые из наиболее важных характеристик процентиля.
- Во-первых, это похоже на другие измерения нецентрального положения. Таким образом, он информирует нас о положении данных по отношению к другим.
- С другой стороны, во многих ситуациях он предоставляет более подробную информацию, чем другие. Например, в некоторых индексах воздействия научных журналов этот показатель используется вместо квартиля.
- Кроме того, это очень полезно для группировки большого количества данных. Когда мы работаем со многими случаями, другие квантили могут давать слишком большие группы, которые трудно интерпретировать.
- Однако у него есть обратная сторона, связанная с вышеизложенным. Это бесполезно для выборок с небольшим количеством случаев, так как группы будут слишком малы. Следовательно, в этих обстоятельствах рекомендуются другие, такие как квартиль или дециль.
Пример процентиля и индекса воздействия
Научные журналы измеряют их важность с помощью так называемых индексов воздействия. Это широко используемый в науке индикатор.
Самым известным является JCR, который делит публикации на квартили. Однако вторым по важности является SJR, который рассчитывается в процентилях.
Итак, давайте представим вымышленный пример, подобный изображенному на картинке.
Мы видим, что то, что мы назвали магазином 1, находится на P15, а 2 - на P55, а 3 - на P95.
В этом случае наибольшее влияние имеет номер три, так как индексы будут отсортированы от наименьшего к наибольшему.