Статистическая нормализация - это масштабное преобразование распределения переменной, позволяющее проводить сравнения по наборам элементов и среднему значению путем исключения эффектов влияний.
Другими словами, нормализация - это пропорции без единиц измерения (безразмерные или масштабно-инвариантные), которые позволяют нам сравнивать элементы разных переменных и разных единиц измерения.
В статистике и эконометрике стандартизованные таблицы распределения вероятностей используются для определения вероятности, которую принимает наблюдение, с учетом функции распределения, которой следует переменная.
Важно не ограничивать термин нормализации только наборами элементов, для которых нормальное распределение является хорошим приближением к их частоте.
Статистическая переменнаяТаблица
В следующей таблице подробно описаны наиболее распространенные стандартизации в статистике, применяемой к финансам и экономике.
- Типизированная или стандартная оценка нормализует ошибки, когда мы можем рассчитать параметры выборки.
- Нормализация в t-распределении Стьюдента нормализует остатки, когда параметры неизвестны, и мы делаем оценку, чтобы получить их.
- Коэффициент вариации использует среднее значение в качестве меры шкалы, в отличие от стандартизованной оценки и t Стьюдента, которые используют стандартное отклонение. Распределение нормировано для распределения Пуассона и экспоненциального распределения.
- Стандартизированный момент может применяться к любому распределению вероятностей, которое имеет функцию, генерирующую момент. Другими словами, интегралы моментов сходятся.
Приложения
Сколько раз мы читали, что нормальное распределение вероятностей кажется достаточно хорошим приближением к частоте наблюдений, и нас просят найти вероятность того, что переменная X принимает определенное значение?
Другими словами, положим X ~ N (μ, σ2), и нас просят найти P (X ≤ xя)
Мы знаем, что для нахождения P (X ≤ xя), нам нужно найти вероятность в таблицах распределения вероятностей. В этом случае в таблицах распределения нормального распределения. Наиболее широко используемые таблицы распределения вероятностей в эконометрике и количественных финансах: хи-квадрат, t Стьюдента, F Фишера-Снедекора, таблица Пуассона, экспонента, Коши и стандартная норма.
Вероятности, вычисленные в таблицах распределения, удовлетворяют свойству:
То есть вероятности (числа в таблице) типизированы. Затем нам также нужно будет ввести нашу переменную в соответствии с параметрами функции распределения, если мы хотим найти вероятность P (X ≤ xя).
Практический пример
Мы хотим знать вероятность того, что в пятницу утром на лыжах будет 288 лыжников.
Горнолыжный курорт сообщает нам, что частота переменной лыжников может приблизительно соответствовать нормальному распределению среднего значения 280 и дисперсии 16.
Итак, имеем:
X ~ N (μ, σ2)
где X определяется как переменная «лыжники».
Они спрашивают нас о вероятности того, что количество лыжников, собирающихся покататься на лыжах в пятницу, меньше или равно 288. То есть:
P (X ≤ 288)
Процесс
Чтобы найти вероятность того, что количество лыжников равно 288, мы сначала должны ввести переменную.
Затем смотрим на таблицу распределения непрерывной стандартной нормали:
Z | 0 | 1 | 2 | 3 |
2,0 | 0,9772 | 0,9778 | 0,9783 | 0,9788 |
Вероятность того, что 288 лыжников будут кататься на лыжах в пятницу утром, составляет 97,72% с учетом параметров среднего и дисперсии.