Data Mining - что это такое, определение и концепция

Содержание:

Data Mining - что это такое, определение и концепция
Data Mining - что это такое, определение и концепция
Anonim

Интеллектуальный анализ данных - это процесс поиска в больших базах данных полезной информации, которая может быть использована для принятия решений.. Также используется английский термин «интеллектуальный анализ данных».

Это можно понимать как технологию и программное обеспечение, используемые для поиска моделей поведения в базе данных. Фундаментальная основа для этого заключается в том, что эти шаблоны помогают в принятии решений. Например, это может помочь компаниям понять модели поведения своих клиентов. Таким образом, это облегчило бы разработку стратегии увеличения продаж или снижения затрат.

Преимущества интеллектуального анализа данных

Основным преимуществом этого процесса анализа данных является большое количество бизнес-сценариев, к которым он может быть применен, например:

  • Прогноз: Прогноз продаж компании.
  • Вероятность: Подбор лучших клиентов для прямого контакта по телефону или электронной почте.
  • Анализ последовательности: Анализ продуктов, которые купили клиенты, и проверка взаимосвязи между ними.

Этапы интеллектуального анализа данных

В процессе интеллектуального анализа данных мы можем выделить пять этапов:

  • Цель и сбор данных: Прежде всего, нужно сосредоточиться на том, какую информацию мы хотим получить. Представим себе пример, когда супермаркет хочет знать, в какое время дня больше всего посетителей. Это будет цель и информация, которую трейдер хочет получить в этом случае.
  • Обработка и управление данными: Когда мы знаем данные, которые хотим собрать, мы запускаем их в работу. Это, пожалуй, самый сложный этап процесса. Что ж, это требует выбора репрезентативной пробы, на которой будет проводиться анализ. После того, как выборка выбрана, необходимо проанализировать, какой тип переменных или регрессионная модель будет применяться к выборке.
  • Выбор модели: Это тесно связано с предыдущим этапом. Речь идет о создании модели или алгоритма, которые дадут нам наилучший результат. Для этого необходимо провести исчерпывающий анализ переменных, которые должны быть включены в модель. Это становится сложной задачей, поскольку она будет зависеть от типа анализируемой информации. Поэтому майнеры данных проводят различные тесты алгоритма, такие как: линейная регрессия, дерево решений, временные ряды, нейронная сеть и т. Д.
  • Анализ и обзор результатов: В основном это анализ результатов, чтобы увидеть, дают ли они логическое объяснение. Объяснение, облегчающее принятие решения на основе информации, предоставленной по результатам.
  • Обновление модели: Последним шагом процесса будет обновление модели. Очень важно, чтобы это делалось со временем, чтобы не устареть. Переменные модели могут стать несущественными, поэтому требуется периодический контроль модели.