Что вам пришло в голову, когда вы услышали термин «машинное обучение»? Роботы-разрушители, решившие истребить человечество с земли? Машинное обучение - это не фантастика или робот, его десятилетиями использовали для самых разных целей. Однако «Спам-фильтр» - одна из первых систем машинного обучения, вызывавших трепет в 1990-х годах.

Машинное обучение - это способность программы учиться через данные. Тем не менее, простая загрузка данных на компьютер не считается машинным обучением. Система или приложение должны быть должным образом обучены или снабжены данными. Например, спам-фильтр вашей электронной почты. Со временем он учится определять, какие электронные письма являются спамом. Это достигается путем распознавания необычно частых словосочетаний, ранее распознаваемых в примерах спама. Мы, люди, тоже можем многому научиться с помощью машинного обучения.

Например, обученный спам-фильтр может выявить слова и шаблоны, которые встречаются в спам-сообщениях. Это может привести к выявлению корреляции, о которой мы никогда раньше не задумывались, но поможет найти решения для проблем. Точно так же использование машинного обучения для обработки большого количества данных и выявления закономерностей называется интеллектуальным анализом данных.

Машинное обучение идеально подходит для использования;

  • Выявление закономерностей и тенденций в больших данных
  • Сложные проблемы, для которых использование традиционного подхода не дает хорошего решения
  • Применяется к динамическим ситуациям, когда машинное обучение может учиться у окружающей среды.
  • Проблемы, для которых существующие решения требуют тщательной настройки или длинных списков правил

Примеры приложений машинного обучения;

  • Автоматическая классификация новостных статей
  • Автоматическое резюмирование длинных документов
  • Для обнаружения опухолей при сканировании головного мозга
  • Классифицировать продукты в продуктовой линейке
  • Чтобы пометить оскорбительные слова на общедоступном форуме
  • Чтобы спрогнозировать выручку компании на следующий год
  • Для создания чат-ботов или личных помощников
  • Создавать игровых ботов для одиночных игроков.
  • Сегментировать клиентов на основе их покупок
  • Рекомендовать товары покупателям на основе моделей покупок.
  • И многое другое ……

Типы машинного обучения

Есть много типов машинного обучения, которые вы можете использовать в своем приложении. Тип машинного обучения определяется многими критериями, такими как тип и количество имеющихся у вас данных, что вы собираетесь делать с моделью машинного обучения, как вы собираетесь обучать свою модель машинного обучения и т. Д.

Основная категоризация ML следующая.

  • Обучается ли модель машинного обучения под наблюдением человека (контролируемое, неконтролируемое, полууправляемое обучение и обучение с подкреплением)
  • Могут ли они учиться постепенно на лету (онлайн или пакетное обучение)

Ниже приведена диаграмма, на которой изображены основные категории систем машинного обучения с некоторыми примерами алгоритмов (в полях желтого цвета).

Давайте рассмотрим каждый из этих типов и попытаемся определить, на что каждый из них способен.

Контролируемое обучение

В этом методе обучающие данные, которые вводятся в систему, также включают метку, в которой указано желаемое решение для каждого случая.

Набор данных в основном разделен на два раздела, таких как данные обучения и тестирования (данные оценки). Обучающий набор используется для точной настройки модели или гипотезы. Эта гипотеза есть не что иное, как математическое представление метода обучения. Во время оценки модели он анализирует ошибку (разницу между ожидаемым значением и значением, выведенным моделью), и цель обучения состоит в том, чтобы точно настроить модель, чтобы получить минимальную ошибку. Обучение оценивалось с использованием обучающей выборки. После этого мы можем использовать наши реальные данные для выполнения желаемых функций (прогнозирование, классификация и т. Д.). В этом задействовано множество алгоритмов, и я надеюсь подробно рассказать вам об этом в следующих блогах.

Типичной задачей обучения с учителем является классификация. Спам-фильтр является хорошим примером этого: он обучен на множестве примеров электронных писем вместе с их классом (спам или ветчина), и он должен научиться классифицировать новые электронные письма.

В регрессии основная цель модели - предсказать некоторые значения (например, будущую стоимость акций, цены на жилье и т. Д.) На основе полученных знаний. Обратите внимание, что некоторые алгоритмы регрессии также могут использоваться для классификации, и наоборот. Например, для классификации обычно используется логистическая регрессия.

Неконтролируемое обучение

Это полная противоположность контролируемому обучению. Здесь данные обучения не включают метки. Система должна учиться сама по себе. Он в основном содержит методы, которые включают группировку точек данных. Например, предположим, что у вас есть много данных о покупателях на вашем веб-сайте или в супермаркете. Вы можете запустить алгоритм кластеризации, чтобы попытаться обнаружить группы похожих клиентов. Используя эту технику, вы можете определить, с какими клиентами вы в основном работали, и можете провести маркетинговую кампанию на основе этой классификации.

Еще одна важная неконтролируемая задача - обнаружение аномалий. Примерами этого являются обнаружение мошенничества с кредитными картами, выявление производственных дефектов, обнаружение и очистка данных при анализе больших данных и т. Д.

Полу-контролируемое обучение

Это когда большая часть обучающих данных немаркирована, а немногие остатки помечены. Таким образом, большинство алгоритмов полууправляемого обучения состоят из комбинации контролируемых и неконтролируемых алгоритмов. Фотографии Google - один из лучших примеров обучения без учителя. Когда мы маркируем имя человека на фотографии, Google Фото может отображать все фотографии, на которых изображен этот человек, благодаря своей способности распознавать лица.

Обучение с подкреплением

Обучение с подкреплением сильно отличается. Здесь система оказывается в ситуации, когда она может предпринять действия. В зависимости от предпринятых действий он будет вознагражден или наказан. Затем система обновляет свою политику действиями, которые она должна и не должна предпринимать. Это будет продолжаться до тех пор, пока не будет найдено оптимальное действие для ситуации. Роботы обычно используют обучение с подкреплением, чтобы научиться ходить.

Другой пример обучения с подкреплением - решение разных игр. Самыми известными должны быть AlphaGo и AlphaGo-Zero. AlphaGo, обученная бесчисленным человеческим играм, и модель достигла уровня, недоступного человеку. В 2016 году программа AlphaGo от Google DeepMind одержала победу в финальной игре против южнокорейского гроссмейстера Го Ли Седола и выиграла серию 4–1, что стало еще одним свидетельством знаменательного достижения программы искусственного интеллекта.

Напоследок хочу упомянуть об искусственных нейронных сетях. ИНС - это изображение естественных нейронов мозга. ИНС в основном задействованы в алгоритмах глубокого обучения и имитируют функции мозга. В зависимости от функциональности ИНС может применяться ко всем типам алгоритмов машинного обучения.

Следите за обновлениями, чтобы увидеть более подробные статьи о машинном обучении и искусственном интеллекте.

Спасибо за чтение !