Статистический процесс - это набор этапов или этапов, которые необходимо выполнить, чтобы провести расследование на основе количественной информации и получить результаты, соответствующие изучаемой реальности.
Когда мы говорим о статистическом процессе, мы говорим о серии шагов, которые желательно выполнить, чтобы получить результаты, соответствующие реальности, которую мы изучаем в статистическом исследовании, которое предполагается провести. Это необходимо, поскольку, если мы не выполним эти шаги, мы можем сделать неправильные выводы и, следовательно, принять неверные решения.
Например, представим, что у нас есть кафе-мороженое. Нам нужно приблизительно знать, сколько мороженого мы должны купить в зависимости от того, какой у нас спрос. Таким образом, если мы не справимся, клиенты смогут связаться с ними, и мы должны будем сказать им, что в этом кафе-мороженом нет мороженого. Напротив, если у нас будет слишком много, это может быть испорчено. Поэтому необходимо попытаться прикинуть, сколько мы должны купить, или хотя бы примерный диапазон. Если для расчета этого диапазона мы собираем данные, которые не являются репрезентативными (например, кафе-мороженое, расположенное в другом городе с меньшим достатком), мы можем ошибаться.
Итак, имея это ясно, мы должны знать последовательность шагов и деталей, которые мы должны выполнить, чтобы результаты были адаптированы к реальности, и мы могли принимать более обоснованные решения.
Этапы статистического процесса
В зависимости от посещенного руководства или автора мы могли видеть разные этапы с разными названиями. По сути, почти все документы по этой теме включают одни и те же разделы, только некоторые включают несколько этапов в одном, а другие более фрагментируют процесс.
В нашем случае мы считаем, что статистический процесс состоит из:
Постановка задачи
В постановке задачи расположена центральная ось, на которой можно сформулировать все остальное. Этот этап отвечает на следующий вопрос: что мне нужно изучать и почему? Иногда, каким бы невероятным это ни казалось, это может привести к выводу, что нам действительно не нужно проводить статистическое исследование.
Сбор данных
Как только мы подняли проблему, мы должны собрать данные. Здесь важна методология. Так что есть разные соображения. Таким образом, мы должны установить тип выборки, размер выборки, тип сбора данных (например, через базы данных или персонализированные опросы), лично, онлайн или по телефону и т. Д.
Организация данных
Когда у нас есть все данные, остается их объединить и упорядочить. Как и во всем остальном, нам нужно ввести данные в программу или платформу, которая затем позволяет нам рассчитывать определенные метрики и правильно анализировать. Для этого всегда удобно систематизировать данные. Более того, иногда нам нужно собирать данные из разных баз данных, которые предлагают разные форматы файлов, и необходимо будет унифицировать все в одном формате.
Анализ данных
Как только проблема будет поднята, данные будут собраны и систематизированы, и мы сможем их эффективно проанализировать. В зависимости от постановки задачи будет проводиться тот или иной анализ. Например, если мы хотим узнать, являются ли две переменные зависимыми, мы могли бы использовать коинтеграционный анализ. Если же мы хотим изучить общую дисперсию финансового актива, мы рассчитаем статистический диапазон.
Интерпретация данных
И последнее, но не менее важное: у нас есть интерпретация данных. Бесполезно проводить все этапы статистического процесса правильно, если в конечном итоге интерпретация неверна. Это потому, что, если интерпретация неверна, решения будут иметь нежелательный эффект. Например, предположим, что мы проводим исследование изменчивости продаж компании. Если после получения результатов выяснится, что существует большой разброс, его следует уменьшить, а мы интерпретируем, что это не так, это может негативно повлиять на компанию.
Пять шагов отражены на следующей диаграмме:
Описательная статистика