Машинное обучение является частью искусственного интеллекта, который определяется как искусственный объект, демонстрирующий когнитивные характеристики разумных людей, такие как обучение и «мышление». О значении термина «машинное обучение» можно догадаться по самому слову, то есть обучение машины.

Как следует из самого термина, при машинном обучении машине предоставляется большой набор данных для обучения. После обучения на данных машина вычисляет для нас правила, то есть алгоритм, который можно использовать в любой момент времени для прогнозирования результата задачи, данные которой были переданы машине.

В целом, машинное обучение позволяет пользователю передавать компьютерному алгоритму огромное количество данных и заставлять компьютер анализировать и давать рекомендации и решения на основе данных, основанные только на входных данных. Таким образом, вместо того, чтобы давать программе правила (как это обычно практиковалось), алгоритм находит правила для нас, тем самым позволяя компьютерам работать автономно без явного программирования. Это снижает довольно большой объем работы и вероятность возникновения дефолтов, позволяя легко решать реальные проблемы с минимальным вмешательством человека. Таким образом, машинное обучение можно использовать для описания проблемы, прогнозирования результата проблемы или предписания/внесения предложений о том, какие действия следует предпринять.

Согласно Оксфордскому словарю, машинное обучение определяется как «использование и развитие компьютерных систем, способных обучаться и адаптироваться без следования четким инструкциям, используя алгоритмы и статистические модели для анализа и получения выводов на основе закономерностей в данных».

Наряду с появлением больших данных, Интернета вещей, микроконтроллеров и т. д. применение машинного обучения для решения проблем стало очевидным во многих областях, таких как:

· Вычислительная биология (секвенирование ДНК, обнаружение опухолей головного мозга, открытие лекарств)

· Компьютерное зрение (распознавание лиц, отслеживание движения, обнаружение объектов)

· Вычислительные финансы (торговля алгоритмами, кредитный рейтинг)

· Автомобильная, аэрокосмическая и производственная (профилактическое обслуживание, самоуправляемые автомобили)

· Обработка естественного языка (распознавание изображений, распознавание голоса, распознавание речи, автоматический языковой перевод)

Давайте поймем, как машина учится!

Подобно тому, как у людей есть разные методы обучения, машины также могут учиться и обучаться с помощью алгоритмов машинного обучения различными способами, причем каждый метод имеет свои плюсы и минусы. Основываясь на этих методах и способах обучения, машинное обучение можно разделить на:

· Контролируемое машинное обучение,

· Неконтролируемое машинное обучение и

· Обучение с подкреплением

1) Машинное обучение под наблюдением

Как следует из названия, этот тип машинного обучения предполагает надзор. Машины обучаются на помеченных наборах данных, а затем могут прогнозировать результаты на основе предоставленного обучения. Другими словами, каждая обучающая выборка из набора данных имеет соответствующую метку или связанное с ней выходное значение. Машина обучается на входных и выходных данных, которые затем тестируются с использованием тестового набора данных, чтобы проверить, насколько хорошо машина может предсказать результат. Во время тестирования набор данных делится на соотношение 80:20, где большая часть соотношения зарезервирована для обучения модели. Затем прогнозы алгоритма сопоставляются с оставшимися 20% набора данных, чтобы обеспечить точные результаты. В результате алгоритм учится предсказывать метки или выходные значения.

Применение: чтобы лучше понять это, давайте рассмотрим пример распознавания изображений, где собаку можно отличить от кошки по их признакам, используя изображения в качестве входных данных для обучения. Машина обучена понимать изображения собак и кошек и запоминать их особенности, такие как глаза, нос, уши, форма, размер и т. д. После обучения предоставляется входное изображение собаки, и ожидается, что машина идентифицирует объект и прогнозировать результат. Обученная машина проверяет различные особенности объекта, такие как глаза, нос, форму и т. д., на входном изображении, чтобы сделать окончательный прогноз. Это процесс идентификации объекта в контролируемом машинном обучении. Точно так же, при наличии данных о погоде за многие годы, машинное обучение способно прогнозировать погоду на конкретное время суток.

Основная цель метода обучения с учителем — сопоставить входную переменную (x) с выходной переменной (y). Машинное обучение под наблюдением подразделяется на две большие категории:

i.) Классификация: когда выходная переменная является категориальной;

Пример: категоризация/классификация на да или нет, правда или ложь, мужчина или женщина и т. д.

Реальные приложения этой категории проявляются в обнаружении спама и фильтрации электронной почты.

Алгоритмы: некоторые из наиболее известных алгоритмов классификации включают алгоритм логистической регрессии, алгоритм случайного леса, алгоритм дерева решений и алгоритм метода опорных векторов.

ii.) Регрессия:где выходная переменная непрерывна; он понимает взаимосвязь между зависимыми и независимыми переменными и то, как независимые переменные (признаки) влияют на зависимую (целевую) переменную.

Примеры. Реальные приложения включают предсказание погоды, анализ рыночных тенденций и т. д.

Алгоритмы.Некоторые из популярных алгоритмов регрессии включают простой алгоритм линейной регрессии, алгоритм многомерной регрессии, алгоритм дерева решений и регрессию Лассо.

2) Неконтролируемое машинное обучение

В отличие от машинного обучения с учителем, метод машинного обучения без учителя не требует контроля. Для обучающих данных нет меток, и алгоритм пытается изучить скрытые/лежащие в основе шаблоны или распределения, управляющие данными. Затем алгоритм стремится сгруппировать (кластерировать) несортированный набор данных на основе сходств, различий и шаблонов входных данных.

Некоторые реальные примеры неконтролируемого машинного обучения включают извлечение темы документа, сегментацию клиентов, обнаружение мошенничества со страховкой, оптимизацию магазина доставки.

Применение. Чтобы еще больше помочь вашему пониманию, рассмотрим случай, когда вам необходимо упорядочить книги в библиотеке по жанрам, а вы не знаете, какие микрожанры вообще существуют. Здесь, используя текст описания книги в качестве входных данных, книги можно легко разделить на разные микрожанры с помощью алгоритмов машинного обучения без учителя. После категоризации машина затем прогнозирует выходные данные, поскольку они тестируются с помощью тестового набора данных. В отличие от обучения с учителем, здесь нет метки, связанной с точками данных. Вместо этого алгоритм должен извлекать знания из данных без какого-либо представления о том, что это за данные и к чему они относятся.

Неконтролируемое машинное обучение далее подразделяется на два типа:

i.) Кластеризация: относится к группированию объектов в кластеры на основе таких параметров, как сходство или различие между объектами.

Пример: группировка клиентов по продуктам, которые они покупают.

Алгоритмы: включают алгоритм кластеризации K-средних, алгоритм среднего сдвига, алгоритм DBSCAN, анализ основных компонентов и анализ независимых компонентов.

ii.) Ассоциация: относится к выявлению типичных отношений между переменными большого набора данных. Он определяет зависимость различных элементов данных и отображает связанные переменные.

Пример: интеллектуальный анализ использования Интернета и анализ рыночных данных.

Алгоритмы: подчинение правилам ассоциации включает алгоритм априори, алгоритм Eclat и алгоритм роста FP.

3) Обучение с подкреплением

Обучение с подкреплением — это метод, основанный на обратной связи или вознаграждении; обучение оптимальному поведению для получения максимального вознаграждения. Скажем, играть в шахматы и учиться выигрывать или проигрывать, а затем учиться оптимальному поведению, чтобы получить максимальную награду. Тем самым он учится действовать определенным образом в определенной среде. Этот тип машинного обучения, как и метод машинного обучения без учителя, лишен контроля. Оптимальное поведение изучается посредством серии наблюдений и взаимодействий с окружающей средой. Таким образом, делая ошибки и учась на них; как и все мы!

Например, например, в секторе розничной торговли обучение с подкреплением может помочь сократить избыточные запасы с помощью динамического ценообразования путем создания модели динамического ценообразования, которая корректирует цену в зависимости от реакции клиентов на предложения.

Поскольку обучение с подкреплением учится на своих действиях (в отсутствие надзора), чтобы в конечном итоге достичь максимального вознаграждения в любой (непредсказуемой) среде, его можно считать лучшим и очень мощным алгоритмом.

Применение. Наиболее распространенным приложением является отображение маршрутов, в котором из всех возможных решений для достижения из точки А в точку Б система должна найти оптимальный маршрут с наименьшим расстоянием и наименьшим временем в пути. Для этого система одновременно оценивает все различные доступные варианты, чтобы найти наилучшее решение. А в случае отсутствия набора данных алгоритм учится на собственном опыте. (Хаа… так похожи на нас!!)

Надеюсь, теперь у вас есть начальные знания о машинном обучении. Давайте углубимся в технические аспекты в следующем блоге по машинному обучению! Наслаждаться!!!