Процентиль - Что это такое, определение и понятие

Процентиль - это статистическая мера положения, делящая упорядоченное распределение данных на сто равных частей.

Эта мера нецентрального положения предоставляет информацию о процентном соотношении наблюдений переменной, упорядоченных от самого низкого до самого высокого, которые ниже ее значения.

Таким образом, 20-й процентиль (P20) будет значением переменной, находящейся на границе первых 20.

Как рассчитывается процентиль?

Как и все квантили, процентиль может быть рассчитан для сгруппированных данных или нет. Для первых есть несколько сложных формул, которые мы можем найти в руководствах по статистике. Для последнего проще всего использовать электронную таблицу.

На изображении мы видим форму представления. Основной прямоугольник представляет данные, упорядоченные от наименьшего к наибольшему, а голубые - различные процентили.

Мы показали три наиболее актуальных. Особенно P50, который соответствует медиане.

Мы также включаем формулу для вашего расчета.

Процентильная характеристика

Давайте посмотрим на некоторые из наиболее важных характеристик процентиля.

  • Во-первых, это похоже на другие измерения нецентрального положения. Таким образом, он информирует нас о положении данных по отношению к другим.
  • С другой стороны, во многих ситуациях он предоставляет более подробную информацию, чем другие. Например, в некоторых индексах воздействия научных журналов этот показатель используется вместо квартиля.
  • Кроме того, это очень полезно для группировки большого количества данных. Когда мы работаем со многими случаями, другие квантили могут давать слишком большие группы, которые трудно интерпретировать.
  • Однако у него есть обратная сторона, связанная с вышеизложенным. Это бесполезно для выборок с небольшим количеством случаев, так как группы будут слишком малы. Следовательно, в этих обстоятельствах рекомендуются другие, такие как квартиль или дециль.

Пример процентиля и индекса воздействия

Научные журналы измеряют их важность с помощью так называемых индексов воздействия. Это широко используемый в науке индикатор.

Самым известным является JCR, который делит публикации на квартили. Однако вторым по важности является SJR, который рассчитывается в процентилях.

Итак, давайте представим вымышленный пример, подобный изображенному на картинке.

Мы видим, что то, что мы назвали магазином 1, находится на P15, а 2 - на P55, а 3 - на P95.

В этом случае наибольшее влияние имеет номер три, так как индексы будут отсортированы от наименьшего к наибольшему.

Вы поможете развитию сайта, поделившись страницей с друзьями

wave wave wave wave wave