Линейный дискриминантный анализ (LDA) - очень распространенный метод, используемый для задач контролируемой классификации. Давайте вместе разберемся, что такое LDA и как он работает.
Что такое линейный дискриминантный анализ?
Линейный дискриминантный анализ - это метод уменьшения размерности, используемый в качестве этапа предварительной обработки в приложениях машинного обучения и классификации шаблонов.
Основная цель технологий уменьшения размерности - уменьшить размеры путем удаления избыточных и зависимых элементов путем преобразования элементов из пространства более высоких измерений в пространство с более низкими измерениями.
Линейный дискриминантный анализ - это метод контролируемой классификации, который учитывает метки. Эта категория уменьшения размерности используется в биометрии, биоинформатике и химии.
Как работает линейный дискриминантный анализ?
Цель линейного дискриминантного анализа - спроецировать характеристики пространства более высокого измерения на пространство более низкого измерения.
Этого можно добиться в три этапа:
Первый шаг - вычислить разделимость между разными классами (то есть расстояние между средними значениями разных классов), также называемое межклассовой дисперсией.
Второй шаг - вычислить расстояние между средним значением и выборкой каждого класса, которое называется дисперсией внутри класса.
Третий шаг - построить пространство более низкой размерности, которое максимизирует дисперсию между классами и минимизирует дисперсию внутри класса. Пусть P будет пространственной проекцией более низкой размерности, которая называется критерием Фишера.
Расширение до LDA:
Линейный дискриминантный анализ - простой и эффективный метод классификации. Поскольку это простой и хорошо понятный метод, существует множество расширений и вариаций этого метода. Некоторые популярные расширения включают в себя:
- Квадратичный дискриминантный анализ (QDA): каждый класс использует свою собственную оценку дисперсии (или ковариации при наличии нескольких входных переменных).
- Гибкий дискриминантный анализ (FDA): используются нелинейные комбинации входных данных, например сплайны.
- Регуляризованный дискриминантный анализ (RDA): вводит регуляризацию в оценку дисперсии (фактически ковариацию), смягчая влияние различных переменных на LDA.
Первоначальная разработка была названа линейным дискриминантным анализом или дискриминантным анализом Фишера. Мультиклассовая версия была отнесена к множественному дискриминантному анализу. Все это сейчас называется просто линейным дискриминантным анализом.
Ссылка: https://machinelearningmastery.com/linear-discriminant-analysis-for-machine-learning/
Удачного обучения!