Что такое машинное обучение?
Машинное обучение — это отрасль искусственного интеллекта и компьютерных наук, которая использует алгоритмы и данные для обучения и прогнозирования. Это дает компьютерам возможность учиться и принимать решения, как люди, без явного программирования. В современном мире он используется практически во всех областях. Некоторые из самых популярных приложений машинного обучения включают виртуальных помощников, беспилотные автомобили, рекомендации в социальных сетях, рекомендации по продуктам, фильтрацию электронной почты и т. д.
Машинное обучение бывает разных типов в зависимости от типа данных, которые оно использует для обучения, и типа прогнозов, которые должны быть сделаны на основе этих данных. В этой статье мы узнаем о четырех различных типах алгоритмов машинного обучения и их реальных приложениях.
Различают следующие типы алгоритмов машинного обучения:
- Контролируемое обучение
- Неконтролируемое обучение
- Полуконтролируемое обучение
- Обучение с подкреплением
Давайте проверим следующий раздел, чтобы узнать больше о них и их применении в реальном мире.
1. Контролируемое обучение:
Это тип машинного обучения, который использует структурированные и помеченные наборы данных для обучения моделей и точного прогнозирования результатов. В этом типе пользователь уже знает тип результата, который требуется от данных. Он содержит независимые переменные, которые используются для обучения модели, а зависимая переменная — это результат, который должен быть предсказан на основе данных. Модель машинного обучения учится на независимых переменных и на их основе делает прогноз на будущее.
Обучение под наблюдением подразделяется на следующие две категории:
- Регрессия. Используется, когда выходные данные представляют собой непрерывное или действительное значение, например, цена автомобиля или вес человека и т. д.
- Классификация. Классификация используется, когда зависимая переменная представляет собой дискретное значение, такое как «спам» или «не спам», «мужской» или «женский» и т. д.
Различные контролируемые алгоритмы: линейная регрессия, логистическая регрессия, K-ближайшие соседи, деревья решений и SVM (машины опорных векторов) и т. д.
Реальные приложения контролируемого обучения следующие:
- Прогноз цен
- Фильтрация спама
- Распознавание лиц
- Распознавание речи
- Классификация изображений
- языковой перевод и т. д.
2. Неконтролируемое обучение:
Это тип машинного обучения, в котором используются неструктурированные и немаркированные наборы данных. Он используется для обнаружения скрытых закономерностей в данных без участия человека. При этом зависимая или целевая переменная неизвестна, что означает, что результат данных неизвестен на начальном этапе. Машина сама обнаруживает закономерности и выдает соответствующие результаты.
Неконтролируемое обучение имеет три общих подхода, которые заключаются в следующем:
- Кластеризация. Это метод, который группирует или формирует кластеры неразмеченных данных в соответствии со сходством или различием свойств данных.
- Правила ассоциации. Это метод, основанный на правилах, который находит связи между различными переменными в наборе данных. Он обычно используется при анализе потребительской корзины.
- Уменьшение размерности. Это метод, который используется для уменьшения количества измерений или объектов в наборе данных, чтобы это не приводило к переоснащению.
Различные алгоритмы неконтролируемого обучения: кластеризация K-средних, K-ближайших соседей, иерархическая кластеризация, анализ основных компонентов и обнаружение аномалий и т. Д.
Реальные приложения обучения без учителя следующие:
- Рекомендательные системы
- Сегментация продукта
- Разделы новостей
- Компьютерное зрение
- Сегментация клиентов и др.
3. Полуконтролируемое обучение:
Это метод машинного обучения, который находится между контролируемым и неконтролируемым обучением. Он использует как помеченные, так и немаркированные данные для обучения алгоритма. Он содержит небольшое количество размеченных данных и большое количество неразмеченных данных. При этом неконтролируемое обучение используется для создания кластеров данных, а затем помеченные данные используются для итеративной маркировки этих немаркированных данных. Это экономит время и деньги, поскольку немаркированные данные можно пометить, используя помеченные данные.
Различают следующие методы полуконтролируемого обучения:
- Генеративные модели
- Разделение с низкой плотностью
- Регуляризация Лапласа
- Эвристические подходы
Реальные приложения обучения с полуучителем следующие:
- Обнаружение речи
- Определение трехмерной структуры белка
- Определение наличия масла в определенном месте
- Классификация веб-контента и т. д.
4. Обучение с подкреплением:
Это метод машинного обучения, основанный на вознаграждении. В этом алгоритме агент подкрепления учится на опыте, на основании которого он принимает последовательность решений. Основная цель агента — действовать, принимая решения, обеспечивающие максимальное вознаграждение в конкретной ситуации. Не существует зависимой переменной или предопределенного решения проблемы, машина сама находит решение, используя метод проб и ошибок.
Различают следующие типы обучения с подкреплением:
- Позитивное обучение с подкреплением
- Обучение с отрицательным подкреплением
Существуют различные алгоритмы обучения с подкреплением, такие как Q-Learning, Deep Q Network, SARSA и DDPG и т. д.
Реальные приложения обучения с подкреплением следующие:
- Обработка изображений
- Игры
- Робототехника
- Навигационная система и т.д.
Вывод:
В этой статье мы узнали о четырех типах алгоритмов машинного обучения: контролируемом, неконтролируемом, полуконтролируемом и обучении с подкреплением с их реальными приложениями. Я также хотел бы подробно объяснить каждый из них отдельно в следующих статьях.
Чтобы узнать больше о будущем контенте, связанном с Python, машинным обучением, наукой о данных и интерфейсной разработкой, подпишитесь на Chirag Rathi!
Приятного обучения!😊
Связаться со мной🤙:
- Линкедин
- Твиттер
- Посетите веб-сайт моего портфолио по адресу chiragrathi.com.