Статистическая нормализация - что это такое, определение и понятие

Содержание:

Anonim

Статистическая нормализация - это масштабное преобразование распределения переменной, позволяющее проводить сравнения по наборам элементов и среднему значению путем исключения эффектов влияний.

Другими словами, нормализация - это пропорции без единиц измерения (безразмерные или масштабно-инвариантные), которые позволяют нам сравнивать элементы разных переменных и разных единиц измерения.

В статистике и эконометрике стандартизованные таблицы распределения вероятностей используются для определения вероятности, которую принимает наблюдение, с учетом функции распределения, которой следует переменная.

Важно не ограничивать термин нормализации только наборами элементов, для которых нормальное распределение является хорошим приближением к их частоте.

Статистическая переменная

Таблица

В следующей таблице подробно описаны наиболее распространенные стандартизации в статистике, применяемой к финансам и экономике.

  • Типизированная или стандартная оценка нормализует ошибки, когда мы можем рассчитать параметры выборки.
  • Нормализация в t-распределении Стьюдента нормализует остатки, когда параметры неизвестны, и мы делаем оценку, чтобы получить их.
  • Коэффициент вариации использует среднее значение в качестве меры шкалы, в отличие от стандартизованной оценки и t Стьюдента, которые используют стандартное отклонение. Распределение нормировано для распределения Пуассона и экспоненциального распределения.
  • Стандартизированный момент может применяться к любому распределению вероятностей, которое имеет функцию, генерирующую момент. Другими словами, интегралы моментов сходятся.

Приложения

Сколько раз мы читали, что нормальное распределение вероятностей кажется достаточно хорошим приближением к частоте наблюдений, и нас просят найти вероятность того, что переменная X принимает определенное значение?

Другими словами, положим X ~ N (μ, σ2), и нас просят найти P (X ≤ xя)

Мы знаем, что для нахождения P (X ≤ xя), нам нужно найти вероятность в таблицах распределения вероятностей. В этом случае в таблицах распределения нормального распределения. Наиболее широко используемые таблицы распределения вероятностей в эконометрике и количественных финансах: хи-квадрат, t Стьюдента, F Фишера-Снедекора, таблица Пуассона, экспонента, Коши и стандартная норма.

Вероятности, вычисленные в таблицах распределения, удовлетворяют свойству:

То есть вероятности (числа в таблице) типизированы. Затем нам также нужно будет ввести нашу переменную в соответствии с параметрами функции распределения, если мы хотим найти вероятность P (X ≤ xя).

Практический пример

Мы хотим знать вероятность того, что в пятницу утром на лыжах будет 288 лыжников.

Горнолыжный курорт сообщает нам, что частота переменной лыжников может приблизительно соответствовать нормальному распределению среднего значения 280 и дисперсии 16.

Итак, имеем:

X ~ N (μ, σ2)

где X определяется как переменная «лыжники».

Они спрашивают нас о вероятности того, что количество лыжников, собирающихся покататься на лыжах в пятницу, меньше или равно 288. То есть:

P (X ≤ 288)

Процесс

Чтобы найти вероятность того, что количество лыжников равно 288, мы сначала должны ввести переменную.

Затем смотрим на таблицу распределения непрерывной стандартной нормали:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Вероятность того, что 288 лыжников будут кататься на лыжах в пятницу утром, составляет 97,72% с учетом параметров среднего и дисперсии.