Ошибка I типа - что это такое, определение и понятие

Содержание:

Ошибка I типа - что это такое, определение и понятие
Ошибка I типа - что это такое, определение и понятие
Anonim

Ошибка 1-го типа в статистике определяется как отклонение нулевой гипотезы, когда она действительно верна. Ошибка типа 1 также известна как ложное срабатывание или альфа-ошибка типа.

Ошибка первого типа - это, по сути, отрицание чего-то, когда это действительно так. Рассмотрим, например, ситуацию проверки того, увеличивает ли маркетинговая кампания, проводимая в социальных сетях, продажи мороженого для компании в летнюю неделю. Гипотезы будут следующие:

ЧАС0: Продажи не растут из-за летней кампании

ЧАС1: Увеличение продаж за счет маркетинговой кампании

После оценки посещаемости сайта компании и страниц, посещенных после кампании, выявляется следующее:

  • Увеличение хотя в трафике и посещениях на 50%.
  • Рост продаж мороженого на 200%.

Принимая во внимание эти результаты, можно сделать вывод, что рекламная кампания была плодотворной и повлияла на увеличение продаж. Однако давайте предположим, что на той неделе была жара, поднявшая температуру выше 40 градусов.

Зная последнее, мы должны были бы принять во внимание фактор высокой температуры как причину увеличения продаж. Если мы не примем это во внимание, мы можем отклонить нашу нулевую гипотезу, когда она верна, то есть мы будем думать, что наша кампания имела оглушительный успех, хотя на самом деле причиной увеличения продаж была сильная жара. Если бы мы пришли к такому выводу, мы бы отвергли нулевую гипотезу, когда она действительно верна, и, следовательно, совершили бы ошибку типа 1.

Причины ошибки 1-го типа

Ошибка типа 1 связана со значимостью контраста или альфа, с ошибкой оценки коэффициентов и может возникать из-за 2 типичных нарушений исходных предположений регрессии. Эти:

  • Условная гетероскедастичность.
  • Серийная корреляция.

Регрессия, представляющая любое из предыдущих нарушений, недооценивает ошибку коэффициентов. Если это произойдет, наша оценка статистики t будет больше, чем фактическая статистика t. Эти большие значения t-статистики увеличивают вероятность того, что значение попадет в зону отклонения.

Представим 2 ситуации.

Ситуация 1 (неверная оценка ошибки)

  • Значимость: 5%
  • Размер образца: 300 человек.
  • Критическое значение: 1,96
  • B1: 1,5
  • Ошибка оценки коэффициента: 0,5

Т = 1,5 / 0,5 = 3

Таким образом, значение попадет в зону отклонения, и мы отвергнем нулевую гипотезу.

Ситуация 2 (правильная оценка погрешности)

  • Значимость: 5%
  • Размер образца: 300 человек.
  • Критическое значение: 1,96
  • B1: 1,5
  • Ошибка оценки коэффициента: 1

Т = 1,5 / 1 = 1,5

Таким образом, значение окажется в зоне отсутствия отклонения, и мы не будем отвергать гипотезу.

Основываясь на предыдущих примерах, ситуация 1, в которой ошибка недооценена, приведет нас к отклонению нулевой гипотезы, когда на самом деле она верна, поскольку, как мы видим в ситуации 2 с правильно оцененной ошибкой, мы не будем отвергать гипотезу быть правдой.