Статистическая нормализация - что это такое, определение и понятие

Статистическая нормализация - это масштабное преобразование распределения переменной, позволяющее проводить сравнения по наборам элементов и среднему значению путем исключения эффектов влияний.

Другими словами, нормализация - это пропорции без единиц измерения (безразмерные или масштабно-инвариантные), которые позволяют нам сравнивать элементы разных переменных и разных единиц измерения.

В статистике и эконометрике стандартизованные таблицы распределения вероятностей используются для определения вероятности, которую принимает наблюдение, с учетом функции распределения, которой следует переменная.

Важно не ограничивать термин нормализации только наборами элементов, для которых нормальное распределение является хорошим приближением к их частоте.

Статистическая переменная

Таблица

В следующей таблице подробно описаны наиболее распространенные стандартизации в статистике, применяемой к финансам и экономике.

  • Типизированная или стандартная оценка нормализует ошибки, когда мы можем рассчитать параметры выборки.
  • Нормализация в t-распределении Стьюдента нормализует остатки, когда параметры неизвестны, и мы делаем оценку, чтобы получить их.
  • Коэффициент вариации использует среднее значение в качестве меры шкалы, в отличие от стандартизованной оценки и t Стьюдента, которые используют стандартное отклонение. Распределение нормировано для распределения Пуассона и экспоненциального распределения.
  • Стандартизированный момент может применяться к любому распределению вероятностей, которое имеет функцию, генерирующую момент. Другими словами, интегралы моментов сходятся.

Приложения

Сколько раз мы читали, что нормальное распределение вероятностей кажется достаточно хорошим приближением к частоте наблюдений, и нас просят найти вероятность того, что переменная X принимает определенное значение?

Другими словами, положим X ~ N (μ, σ2), и нас просят найти P (X ≤ xя)

Мы знаем, что для нахождения P (X ≤ xя), нам нужно найти вероятность в таблицах распределения вероятностей. В этом случае в таблицах распределения нормального распределения. Наиболее широко используемые таблицы распределения вероятностей в эконометрике и количественных финансах: хи-квадрат, t Стьюдента, F Фишера-Снедекора, таблица Пуассона, экспонента, Коши и стандартная норма.

Вероятности, вычисленные в таблицах распределения, удовлетворяют свойству:

То есть вероятности (числа в таблице) типизированы. Затем нам также нужно будет ввести нашу переменную в соответствии с параметрами функции распределения, если мы хотим найти вероятность P (X ≤ xя).

Практический пример

Мы хотим знать вероятность того, что в пятницу утром на лыжах будет 288 лыжников.

Горнолыжный курорт сообщает нам, что частота переменной лыжников может приблизительно соответствовать нормальному распределению среднего значения 280 и дисперсии 16.

Итак, имеем:

X ~ N (μ, σ2)

где X определяется как переменная «лыжники».

Они спрашивают нас о вероятности того, что количество лыжников, собирающихся покататься на лыжах в пятницу, меньше или равно 288. То есть:

P (X ≤ 288)

Процесс

Чтобы найти вероятность того, что количество лыжников равно 288, мы сначала должны ввести переменную.

Затем смотрим на таблицу распределения непрерывной стандартной нормали:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Вероятность того, что 288 лыжников будут кататься на лыжах в пятницу утром, составляет 97,72% с учетом параметров среднего и дисперсии.

Популярные посты

Как сэкономить на счете за электроэнергию с фиксированной ставкой

Какие фиксированные ставки на электроэнергию? Фиксированные ставки в целом всегда являются синонимом «все, что вы хотите, по той же цене». Другими словами, это формулы, по которым пользователи могут получать услугу по фиксированной цене независимо от того, что они потребляют. Это предложение традиционно произошло в мире торговли.…