Скорректированный R в квадрате (Скорректированный коэффициент детерминации)

Содержание:

Скорректированный R в квадрате (Скорректированный коэффициент детерминации)
Скорректированный R в квадрате (Скорректированный коэффициент детерминации)
Anonim

Скорректированный квадрат R (или скорректированный коэффициент детерминации) используется в множественной регрессии, чтобы увидеть степень интенсивности или эффективности независимых переменных в объяснении зависимой переменной.

Проще говоря, скорректированный R-квадрат говорит нам, какой процент вариации зависимой переменной в совокупности объясняется всеми независимыми переменными.

Использование этого коэффициента оправдано тем, что по мере добавления переменных в регрессию нескорректированный коэффициент детерминации имеет тенденцию к увеличению. Даже когда предельный вклад каждой из новых добавленных переменных не имеет статистической значимости.

Следовательно, добавляя переменные к модели, коэффициент детерминации может увеличиваться, и мы можем ошибочно думать, что выбранный набор переменных способен объяснить большую часть вариации независимой переменной. Эта проблема широко известна как «переоценка модели».

Коэффициент вариацииРегрессионный анализ

Формула скорректированного коэффициента детерминации

Для решения описанной выше проблемы многие исследователи предлагают корректировать коэффициент детерминации по следующей формуле:

р2 к → Скорректированный квадрат R или скорректированный коэффициент детерминации

р2 → R в квадрате или коэффициент детерминации

п → Количество наблюдений в выборке

k → Количество независимых переменных

Учитывая, что 1-R2 - постоянное число, и поскольку n больше k, по мере добавления переменных в модель частное в скобках становится больше. Вследствие этого. также результат умножения на 1-R2 . Таким образом, мы видим, что формула построена для корректировки и штрафных санкций за включение коэффициентов в модель.

В дополнение к предыдущему преимуществу корректировка, использованная в предыдущей формуле, также позволяет нам сравнивать модели с различным количеством независимых переменных. Опять же, формула регулирует количество переменных между одной моделью и другой и позволяет нам проводить однородное сравнение.

Возвращаясь к предыдущей формуле, мы можем сделать вывод, что скорректированный коэффициент детерминации всегда будет равен или меньше коэффициента R2. В отличие от коэффициента детерминации, который варьируется от 0 до 1, скорректированный коэффициент детерминации может быть отрицательным по двум причинам:

  • Чем ближе k приближается к n.
  • Чем ниже коэффициент детерминации.
Коэффициент линейной корреляции