Дисперсионный анализ - что это такое, определение и понятие

Дисперсионный анализ или ANOVA (дисперсионный анализ) - это методы многомерного анализа зависимостей, используемые для определения наличия значительных различий между средними значениями трех или более групп населения.

Таким образом, с помощью этого анализа мы узнаем, есть ли различия между определенными группами, когда мы изменим одну или несколько характеристик. Чтобы выяснить это, мы используем среднее значение данных.

Его очень часто используют в таких областях, как экономика или медицина.

Предыдущие допущения дисперсионного анализа

Необходимо знать ряд предварительных условий для выполнения ANOVA. Это важно для получения адекватных результатов.

  • Во-первых, популяция должна соответствовать нормальному распределению. Следовательно, мы имеем дело с типом параметрического контраста, так как параметры совокупности среднего и стандартного отклонения известны.
  • Кроме того, используемые образцы должны быть независимыми друг от друга. Это означает, что изменение одного из них не должно влиять на ценность других.
  • С другой стороны, дисперсия исследуемых популяций должна быть одинаковой. Это называется гомоскедастичностью.

Классификация анализа дисперсионных моделей

Для анализа моделей дисперсии могут использоваться три приведенные ниже классификации:

  • Модель с фиксированными эффектами: Население нормальное и различается только величиной соответствующих средних значений.
  • Модель случайных эффектов: В этом случае данные имеют иерархию, и от нее зависят различия в населении.
  • Модель со смешанными эффектами: Мы бы столкнулись с моделью, которая представляет собой смесь двух предыдущих.

Пример ANOVA: важные концепции

Существуют математические уравнения некоторой сложности для выполнения ANOVA. Тем не менее, на сайте Economy-Wiki.com мы выбираем простую экономию, и поэтому, используя преимущества технологий, мы собираемся показать, как это можно сделать в электронной таблице.

Давайте представим, что мы хотим знать, есть ли существенные различия между читателями Economy-Wiki.com, основанные на сродстве их степени с экономикой.

Предупреждение: данные, которые мы будем использовать, являются вымышленными.

Мы должны перейти в Данные, Анализ данных, и мы выберем дисперсионный анализ фактора.

Ранг будет матрицей трех групп. Возможно, будет интереснее включить заголовки после этого и придать желаемое форматирование. В нашем случае с логотипом и синим цветом.

Мы видим, что есть некоторые понятия, такие как степени свободы, вероятность или значимость. Первый рассчитывается автоматически и представляет собой количество групп минус одна. Второй говорит нам, существенны ли различия или нет.

Обычно вы начинаете с приемлемого уровня доверия. В экономике это обычно 95% (0,95), что связано со значимостью 0,05 (1-0,095). Таким образом, если эта вероятность или значение p ниже принятой значимости, различия значительны.

В этом случае кажется, что степень не влияет на количество читателей (значимость> 0,05). Таким образом, дисперсионный анализ показывает, что Economy-Wiki.com интересует всех, а не только специализированных читателей. Конечно это фиктивные данные или нет?

Популярные посты

Банковское дело полностью трансформировалось после кризиса, продолжит реконфигурировать себя

24 мая президент BBVA Франсиско Гонсалес заявил Институту международных финансов, что «отрицательные ставки убивают банки». Эти заявления сформулированы в сложном экономическом контексте, когда Европейский центральный банк пытается оживить европейскую экономику с помощью политики денежно-кредитной экспансии.…

Графен, почему он считается материалом будущего?

В 1930 году был открыт этот новый материал, который до 1994 года не носил того названия, под которым он известен сегодня, - графена. Компонент, на который возлагались большие надежды, благодаря его свойствам, связанным с теплопроводностью и электропроводностью, а также его сопротивлением и эластичностью. Среди его приложений, которые могут сильно повлиять на пользователяПодробнее…