Значение p, от английского, p-значение, является минимальным непроизвольным уровнем значимости, с которым мы можем отклонить нулевую гипотезу (H0) с учетом функции распределения и тестовой статистики.
Другими словами, p-значение - это минимальная вероятность, определяемая распределением, с которой мы можем отклонить нулевую гипотезу (H0) без необходимости определять априори уровень значимости контраста.
Если вы помните, вы помните, что площадь под кривой функции распределения является вероятностью. Таким образом, с этой точки зрения p-значение будет вероятностью наблюдения такой экстремальной тестовой статистики для истинности нулевой гипотезы.
Домен
Поскольку p-значение является вероятностью, это значение будет между 0 и 1.
Не произвольно
В отличие от уровней значимости, которые мы привыкли видеть, таких как 1%, 5% и 10%, p-значение зависит от функции распределения, которую имеет тестовая статистика. Таким образом, уровни 1%, 5% и 10% определяются в начале контраста. Такой выбор называется произвольным.
Формула P-значения
Значение p не является единственным значением, как критическое значение, но будет зависеть от статистики. Для разных значений статистики теста критическое значение будет одинаковым. С другой стороны, для разных значений тестовой статистики значение p также будет различным, потому что p-значение зависит от значения, которое принимает тестовая статистика.
Где,
- D - случайная величина, которая подчиняется определенному распределению.
- d - значение тестовой статистики.
Расчет
Можно вычислить p-значение вручную, но вам потребуются очень точные таблицы распределения, то есть со многими десятичными знаками, потому что p-значение имеет тенденцию быть маленьким. Большинство статистических программ уже включили p-значение, и оно обычно появляется в результатах оценки методом наименьших квадратов (OLS). Это может показаться трудным в использовании, но с практикой это очень полезный инструмент.
Для расчета p-значения нам потребуется:
- Статистика контрастности.
- Распределение статистики контраста и знание ее параметров.
Правило отклонения
Если p-значение < уровень значимости => отклонение H0.
Если p-значение > уровень значимости => Нет отклонения H0.
Представление
В случае t-распределения Стьюдента с 2 степенями свободы и статистикой контраста, равной 3, вероятность обнаружения такой экстремальной статистики, когда нулевая гипотеза (H0) верна, составляет 4,77%.
Другими словами, если бы нулевая гипотеза (H0) была верной, статистика, равная 3, наблюдалась бы только в 4,77% случаев.
Почему это называется p-значением?
Название p-значения происходит от определения, которое относится к площади под кривой функции распределения за пределами доверительного интервала. Затем, поскольку эта область представляет собой минимальную вероятность отклонения нулевой гипотезы, «p» значения p относится к вероятность. И поскольку p-значение соответствует числу и, следовательно, значению, слово «значение» p-value приписывается числовому значению. В некоторых книгах мы можем найти «значение вероятности», относящееся к p-значению. Возможно, фраза «минимальная вероятность отклонить нулевую гипотезу» была слишком длинной и не таила в себе никакой тайны для студентов …