Какой алгоритм машинного обучения следует использовать в зависимости от типа проблемы?

Когда я только начинал заниматься наукой о данных, я часто сталкивался с проблемой выбора наиболее подходящего алгоритма для моей конкретной проблемы. Если вы похожи на меня, открывая статью об алгоритмах машинного обучения, вы видите десятки подробных описаний. парадокс в том, что они не облегчают выбор.

Что ж, чтобы вы не сбились с пути, я бы посоветовал вам хорошо разбираться в реализации и математической интуиции, лежащей в основе нескольких контролируемых и неконтролируемых алгоритмов машинного обучения, таких как:

Линейная регрессия
Логистическая регрессия
Дерево решений
Наивный байесовский
Поддержка векторной машины
Случайный лес
AdaBoost
Деревья с усилением градиента
Простая нейронная сеть
Иерархическая кластеризация
Модель смеси Гаусса
Сверточная нейронная сеть
Рекуррентная нейронная сеть
Рекомендательная система

Помните, что список алгоритмов машинного обучения, о которых я упоминал, - это те алгоритмы, которые необходимо хорошо знать, пока вы новичок в машинном / глубоком обучении!

Теперь, когда у нас есть некоторая интуиция в отношении типов задач машинного обучения, давайте рассмотрим наиболее популярные алгоритмы с их приложениями в реальной жизни на основе их постановок задач!

Попытайтесь поработать над каждой из этих формулировок проблемы после того, как дочитаете до конца этого блога! Уверяю, вы многому научитесь, черт возьми!

Постановка проблемы 1 -

Прогнозирование цен на жилье

Алгоритмы машинного обучения для решения проблемы -

Расширенные методы регрессии, такие как случайный лес и усиление градиента

Постановка проблемы 2 -

Изучите демографические данные клиентов, чтобы выявить закономерности

Алгоритмы машинного обучения для решения проблемы -

Кластеризация (метод локтя)

Постановка проблемы 3 -

Прогнозируемое погашение кредита

Алгоритмы машинного обучения для решения проблемы -

Алгоритмы классификации для несбалансированного набора данных

Постановка проблемы 4 -

Определите, является ли поражение кожи доброкачественным или злокачественным, основываясь на его характеристиках (размере, форме, цвете и т. д.)

Алгоритмы машинного обучения для решения проблемы -

Сверточная нейронная сеть (U-Net - лучший вариант для сегментации)

Постановка проблемы 5 -

Прогнозируйте отток клиентов

Алгоритмы машинного обучения для решения проблемы -

Линейный дискриминантный анализ (LDA) или Квадратичный дискриминантный анализ (QDA)

(особенно популярен, потому что это одновременно классификатор и метод уменьшения размерности)

Постановка проблемы 6 -

Предоставьте основу для принятия решений о приеме на работу новых сотрудников

Алгоритмы машинного обучения для решения проблемы -

Дерево решений здесь для профессиональных игроков

Постановка проблемы 7 -

Понимание и прогнозирование атрибутов продукта, которые повышают вероятность того, что продукт будет куплен

Алгоритмы машинного обучения для решения проблемы -

Логистическая регрессия
Дерево решений

Постановка проблемы 8 -

Анализируйте настроения, чтобы оценить восприятие продукта на рынке.

Алгоритмы машинного обучения для решения проблемы -

Наивный байесовский метод - машины опорных векторов (NBSVM)

Постановка проблемы 9 -

Создайте систему классификации для фильтрации спама

Алгоритмы машинного обучения для решения проблемы -

Алгоритмы классификации -

Предлагаются наивный байесовский метод, SVM, многослойные нейронные сети персептронов (MLPNN) и нейронные сети с радиальными базовыми функциями (RBFNN).

Постановка проблемы 10 -

Предскажите, насколько вероятно, что кто-то нажмет на объявление в Интернете

Алгоритмы машинного обучения для решения проблемы -

Логистическая регрессия
Поддержка векторных машин

Постановка проблемы 11 -

Обнаружение мошенничества при транзакциях с кредитными картами.

Алгоритмы машинного обучения для решения проблемы -

Adaboost
Изолированный лес
Случайный лес

Постановка проблемы 12 -

Прогнозируйте цены на автомобили на основе их характеристик

Алгоритмы машинного обучения для решения проблемы -

Лучше всего для этого подходят деревья с усилением градиента.

Постановка проблемы 13 -

Предскажите вероятность того, что пациент присоединится к программе здравоохранения

Алгоритмы машинного обучения для решения проблемы -

Простые нейронные сети

Постановка проблемы 14 -

Предскажите, будут ли зарегистрированные пользователи готовы платить определенную цену за продукт.

Алгоритмы машинного обучения для решения проблемы -

Нейронные сети

Постановка проблемы 15 -

Сегментируйте клиентов на группы по различным характеристикам (например, по возрастной группе)

Алгоритмы машинного обучения для решения проблемы -

Кластеризация K-средних

Постановка проблемы 16 -

Извлечение функций из речевых данных для использования в системах распознавания речи

Алгоритмы машинного обучения для решения проблемы -

Модель гауссовой смеси

Постановка проблемы 17 -

Отслеживание нескольких объектов, когда количество компонентов смеси и их средства позволяют прогнозировать расположение объектов в каждом кадре видеопоследовательности.

Алгоритмы машинного обучения для решения проблемы -

Модель смеси Гаусса

Постановка проблемы 18 -

Организация генов и образцов из серии экспериментов с микрочипами для выявления интересных с биологической точки зрения закономерностей.

Алгоритмы машинного обучения для решения проблемы -

Алгоритмы иерархической кластеризации

Постановка проблемы 19 -

Рекомендуйте, какие фильмы следует смотреть потребителям, на основе предпочтений других клиентов с похожими характеристиками.

Алгоритмы машинного обучения для решения проблемы -

Рекомендательная система

Постановка проблемы 20 -

Рекомендуйте новостные статьи, которые читатель может захотеть прочитать, на основе статьи, которую он читает.

Алгоритмы машинного обучения для решения проблемы -

Рекомендательная система

Постановка проблемы 21 -

Рекомендуйте новостные статьи, которые читатель может захотеть прочитать, на основе статьи, которую он читает.

Алгоритмы машинного обучения для решения проблемы -

Рекомендательная система

Постановка проблемы 22 -

Оптимизация поведения при вождении беспилотных автомобилей

Алгоритмы машинного обучения для решения проблемы -

Обучение с подкреплением

Постановка проблемы 23 -

Диагностируйте болезни по медицинским снимкам.

Алгоритмы машинного обучения для решения проблемы -

Сверточные нейронные сети

Постановка проблемы 24 -

Уравновешивайте нагрузку на электросети при различных циклах потребления

Алгоритмы машинного обучения для решения проблемы -

Обучение с подкреплением

Постановка проблемы 25 -

Когда вы работаете с данными или последовательностями временных рядов (например, аудиозаписями или текстом)

Алгоритмы машинного обучения для решения проблемы -

Рекуррентная нейронная сеть
LSTM

Постановка проблемы 26 -

Обеспечьте языковой перевод

Алгоритмы машинного обучения для решения проблемы -

Рекуррентная нейронная сеть

Постановка проблемы 27 -

Создавайте подписи для изображений

Алгоритмы машинного обучения для решения проблемы -

Рекуррентная нейронная сеть

Постановка проблемы 28 -

Мощные чат-боты, которые могут удовлетворить более тонкие потребности и запросы клиентов

Алгоритмы машинного обучения для решения проблемы -

Рекуррентная нейронная сеть

Я надеюсь, что смогу объяснить вам общее восприятие наиболее часто используемых алгоритмов машинного обучения и дать интуитивное представление о том, как выбрать один из них для вашей конкретной проблемы.

Удачного машинного обучения! :)

До скорого..!

Свяжитесь со мной через LinkedIn

Machine Learning Deep Learning Reinforcement Learning Computer Vision Algorithms

26.11.2022