Дисперсионный анализ или ANOVA (дисперсионный анализ) - это методы многомерного анализа зависимостей, используемые для определения наличия значительных различий между средними значениями трех или более групп населения.
Таким образом, с помощью этого анализа мы узнаем, есть ли различия между определенными группами, когда мы изменим одну или несколько характеристик. Чтобы выяснить это, мы используем среднее значение данных.
Его очень часто используют в таких областях, как экономика или медицина.
Предыдущие допущения дисперсионного анализа
Необходимо знать ряд предварительных условий для выполнения ANOVA. Это важно для получения адекватных результатов.
- Во-первых, популяция должна соответствовать нормальному распределению. Следовательно, мы имеем дело с типом параметрического контраста, так как параметры совокупности среднего и стандартного отклонения известны.
- Кроме того, используемые образцы должны быть независимыми друг от друга. Это означает, что изменение одного из них не должно влиять на ценность других.
- С другой стороны, дисперсия исследуемых популяций должна быть одинаковой. Это называется гомоскедастичностью.
Классификация анализа дисперсионных моделей
Для анализа моделей дисперсии могут использоваться три приведенные ниже классификации:
- Модель с фиксированными эффектами: Население нормальное и различается только величиной соответствующих средних значений.
- Модель случайных эффектов: В этом случае данные имеют иерархию, и от нее зависят различия в населении.
- Модель со смешанными эффектами: Мы бы столкнулись с моделью, которая представляет собой смесь двух предыдущих.
Пример ANOVA: важные концепции
Существуют математические уравнения некоторой сложности для выполнения ANOVA. Тем не менее, на сайте Economy-Wiki.com мы выбираем простую экономию, и поэтому, используя преимущества технологий, мы собираемся показать, как это можно сделать в электронной таблице.
Давайте представим, что мы хотим знать, есть ли существенные различия между читателями Economy-Wiki.com, основанные на сродстве их степени с экономикой.
Предупреждение: данные, которые мы будем использовать, являются вымышленными.
Мы должны перейти в Данные, Анализ данных, и мы выберем дисперсионный анализ фактора.
Ранг будет матрицей трех групп. Возможно, будет интереснее включить заголовки после этого и придать желаемое форматирование. В нашем случае с логотипом и синим цветом.
Мы видим, что есть некоторые понятия, такие как степени свободы, вероятность или значимость. Первый рассчитывается автоматически и представляет собой количество групп минус одна. Второй говорит нам, существенны ли различия или нет.
Обычно вы начинаете с приемлемого уровня доверия. В экономике это обычно 95% (0,95), что связано со значимостью 0,05 (1-0,095). Таким образом, если эта вероятность или значение p ниже принятой значимости, различия значительны.
В этом случае кажется, что степень не влияет на количество читателей (значимость> 0,05). Таким образом, дисперсионный анализ показывает, что Economy-Wiki.com интересует всех, а не только специализированных читателей. Конечно это фиктивные данные или нет?