Дисперсионный анализ - что это такое, определение и понятие

Содержание:

Anonim

Дисперсионный анализ или ANOVA (дисперсионный анализ) - это методы многомерного анализа зависимостей, используемые для определения наличия значительных различий между средними значениями трех или более групп населения.

Таким образом, с помощью этого анализа мы узнаем, есть ли различия между определенными группами, когда мы изменим одну или несколько характеристик. Чтобы выяснить это, мы используем среднее значение данных.

Его очень часто используют в таких областях, как экономика или медицина.

Предыдущие допущения дисперсионного анализа

Необходимо знать ряд предварительных условий для выполнения ANOVA. Это важно для получения адекватных результатов.

  • Во-первых, популяция должна соответствовать нормальному распределению. Следовательно, мы имеем дело с типом параметрического контраста, так как параметры совокупности среднего и стандартного отклонения известны.
  • Кроме того, используемые образцы должны быть независимыми друг от друга. Это означает, что изменение одного из них не должно влиять на ценность других.
  • С другой стороны, дисперсия исследуемых популяций должна быть одинаковой. Это называется гомоскедастичностью.

Классификация анализа дисперсионных моделей

Для анализа моделей дисперсии могут использоваться три приведенные ниже классификации:

  • Модель с фиксированными эффектами: Население нормальное и различается только величиной соответствующих средних значений.
  • Модель случайных эффектов: В этом случае данные имеют иерархию, и от нее зависят различия в населении.
  • Модель со смешанными эффектами: Мы бы столкнулись с моделью, которая представляет собой смесь двух предыдущих.

Пример ANOVA: важные концепции

Существуют математические уравнения некоторой сложности для выполнения ANOVA. Тем не менее, на сайте Economy-Wiki.com мы выбираем простую экономию, и поэтому, используя преимущества технологий, мы собираемся показать, как это можно сделать в электронной таблице.

Давайте представим, что мы хотим знать, есть ли существенные различия между читателями Economy-Wiki.com, основанные на сродстве их степени с экономикой.

Предупреждение: данные, которые мы будем использовать, являются вымышленными.

Мы должны перейти в Данные, Анализ данных, и мы выберем дисперсионный анализ фактора.

Ранг будет матрицей трех групп. Возможно, будет интереснее включить заголовки после этого и придать желаемое форматирование. В нашем случае с логотипом и синим цветом.

Мы видим, что есть некоторые понятия, такие как степени свободы, вероятность или значимость. Первый рассчитывается автоматически и представляет собой количество групп минус одна. Второй говорит нам, существенны ли различия или нет.

Обычно вы начинаете с приемлемого уровня доверия. В экономике это обычно 95% (0,95), что связано со значимостью 0,05 (1-0,095). Таким образом, если эта вероятность или значение p ниже принятой значимости, различия значительны.

В этом случае кажется, что степень не влияет на количество читателей (значимость> 0,05). Таким образом, дисперсионный анализ показывает, что Economy-Wiki.com интересует всех, а не только специализированных читателей. Конечно это фиктивные данные или нет?