Линейный дискриминантный анализ или линейный дискриминантный анализ (LDA) - это статистический метод, который создает функцию, способную классифицировать явления с учетом ряда различающих переменных и вероятности принадлежности.
Следовательно, мы имеем дело с типом статистической процедуры, которая стремится к группировке на основе определенных сходств. Таким образом, он позволяет количественно оценить вероятность принадлежности к той или иной группе. Эти группы известны априори, в отличие от кластерного анализа.
Математическая модель дискриминантного анализа.
Посмотрим, как будет выглядеть математическая модель дискриминантного анализа.
Это очень просто, поскольку основано на системе линейных уравнений. Конечно, анализ более сложен, но это выходит за рамки работы Economy-Wiki.com, простой экономики.
Как мы видим, они представляют собой набор уравнений, зависимая переменная (y) которых представляет определенные баллы. Они, в свою очередь, являются линейными функциями других дискриминантных переменных (X) и ряда параметров (a).
Целью этих линейных комбинаций является максимальное увеличение дисперсии между группами и минимизация дисперсии между группами. Таким образом, новые случаи могут быть сгруппированы с определенной вероятностью, из которой мы можем знать их ценность, при условии, что они соответствуют этим критериям.
Процесс проведения дискриминантного анализа
Давайте посмотрим, как можно провести анализ такого типа:
- Сначала вам нужно создать таблицу данных с наблюдениями и переменными. Также включена категориальная переменная, которая определяет каждую из групп.
- Далее создается математическая модель с числовыми данными. Это будет основано на том, что мы видели в предыдущем разделе. Статистическое программное обеспечение, такое как SPSS или бесплатная R, автоматизирует весь процесс.
- Наконец, с помощью этого анализа мы сможем объяснить, почему каждый случай принадлежит той или иной группе, и, кроме того, установить критерий принадлежности для новых случаев. Это будет основано на вероятности быть включенным в одно или другое.
Примеры применения дискриминантного анализа
В заключение рассмотрим несколько примеров применения дискриминантного анализа.
Давайте также вспомним, что во всех из них цель состоит в том, чтобы создать дискриминантную функцию, которая группирует каждый новый случай в соответствии с вероятностью.
- Мы хотим классифицировать разные страны на основе их макроэкономических данных.: Слаборазвитые, развивающиеся или развитые страны (группы). Мы создаем дискриминантную функцию, чтобы можно было вычислить вероятность принадлежности страны к той или иной группе.
- Мы хотим провести маркетинговую кампанию, и нам интересно знать, в какие группы следует классифицировать людей.: Таким образом, мы можем ответить на определенные вопросы, например, каковы будут характеристики случайного покупателя.
- Мы хотим знать уровень риска (группу) определенных клиентов в отношении предоставления кредита.: Мы будем использовать переменные, связанные с вашим доходом, ежемесячными расходами, историей или типом работы. Дискриминантная функция предоставляет нам актуальную информацию о платежеспособности.
Как видим, дискриминантный анализ очень полезен во многих ситуациях. Но не только в области экономики, он также используется в медицине, геологии, биологии и других областях.