P-value - Что это такое, определение и понятие

Содержание:

Anonim

Значение p, от английского, p-значение, является минимальным непроизвольным уровнем значимости, с которым мы можем отклонить нулевую гипотезу (H0) с учетом функции распределения и тестовой статистики.

Другими словами, p-значение - это минимальная вероятность, определяемая распределением, с которой мы можем отклонить нулевую гипотезу (H0) без необходимости определять априори уровень значимости контраста.

Если вы помните, вы помните, что площадь под кривой функции распределения является вероятностью. Таким образом, с этой точки зрения p-значение будет вероятностью наблюдения такой экстремальной тестовой статистики для истинности нулевой гипотезы.

Домен

Поскольку p-значение является вероятностью, это значение будет между 0 и 1.

Не произвольно

В отличие от уровней значимости, которые мы привыкли видеть, таких как 1%, 5% и 10%, p-значение зависит от функции распределения, которую имеет тестовая статистика. Таким образом, уровни 1%, 5% и 10% определяются в начале контраста. Такой выбор называется произвольным.

Формула P-значения

Значение p не является единственным значением, как критическое значение, но будет зависеть от статистики. Для разных значений статистики теста критическое значение будет одинаковым. С другой стороны, для разных значений тестовой статистики значение p также будет различным, потому что p-значение зависит от значения, которое принимает тестовая статистика.

Где,

  • D - случайная величина, которая подчиняется определенному распределению.
  • d - значение тестовой статистики.

Расчет

Можно вычислить p-значение вручную, но вам потребуются очень точные таблицы распределения, то есть со многими десятичными знаками, потому что p-значение имеет тенденцию быть маленьким. Большинство статистических программ уже включили p-значение, и оно обычно появляется в результатах оценки методом наименьших квадратов (OLS). Это может показаться трудным в использовании, но с практикой это очень полезный инструмент.

Для расчета p-значения нам потребуется:

  • Статистика контрастности.
  • Распределение статистики контраста и знание ее параметров.

Правило отклонения

Если p-значение < уровень значимости => отклонение H0.

Если p-значение > уровень значимости => Нет отклонения H0.

Представление

В случае t-распределения Стьюдента с 2 степенями свободы и статистикой контраста, равной 3, вероятность обнаружения такой экстремальной статистики, когда нулевая гипотеза (H0) верна, составляет 4,77%.

Другими словами, если бы нулевая гипотеза (H0) была верной, статистика, равная 3, наблюдалась бы только в 4,77% случаев.

Почему это называется p-значением?

Название p-значения происходит от определения, которое относится к площади под кривой функции распределения за пределами доверительного интервала. Затем, поскольку эта область представляет собой минимальную вероятность отклонения нулевой гипотезы, «p» значения p относится к вероятность. И поскольку p-значение соответствует числу и, следовательно, значению, слово «значение» p-value приписывается числовому значению. В некоторых книгах мы можем найти «значение вероятности», относящееся к p-значению. Возможно, фраза «минимальная вероятность отклонить нулевую гипотезу» была слишком длинной и не таила в себе никакой тайны для студентов …