1. Что такое машинное обучение?

«Думаю, мне следует узнать, что означает это предложение? Обучение — это универсальная черта, которая приобретается каждым живым организмом, как птица учится летать, тигр учится охотиться на свою добычу и т. д. Но если я скажу, что машина тоже может учиться!! Раньше мы задавались вопросом, что, если мы скажем «Включи свет», и свет включится, это было похоже на сон, но этот сон сбылся сейчас, мы живем в эпоху, когда машины не меньше, чем люди. Мы можем научить машину учиться, а также они могут учиться сами, это называется МАШИННОЕ ОБУЧЕНИЕ.

В математике, особенно в области вероятности, статистика играет важную роль в машинном обучении. Поскольку машина может предсказывать будущее и определять вероятность определенного события, выполняя несколько вычислений и применяя алгоритм.

2. Почему машинное обучение и его применение

Если говорить на непрофессиональном языке, то машинное обучение похоже на лопасти (гребцы), которые используются для гребных лодок, их можно использовать в любом типе воды, например, в океане, в озерах. Точно так же машинное обучение можно использовать во множестве областей. Некоторые, если домен: -

Эта постановка задачи взята из kaggle (обсудим позже)

· Здравоохранение: прогнозирование диагноза пациента для рассмотрения врачами.

· Социальная сеть: предсказание определенных предпочтений на сайте знакомств для лучшей совместимости.

· Финансы: прогнозирование мошеннических действий с кредитной картой.

· Электронная коммерция: прогнозирование оттока клиентов

· Биология: поиск закономерностей в генных мутациях, которые могут указывать на рак.

3. Как научиться машинному обучению

Машина работает так же, как люди, как человек учится, наблюдая, так как машина, машина ищет шаблон и учится в соответствии с шаблоном, чтобы сделать его более разумным, мы должны предоставить ему большие данные, чтобы он наблюдал различные типы шаблонов и учился и дать желаемый результат.

Мы должны предоставить машине правильные и правильные данные, например, если вы полицейский и ваша миссия состоит в том, чтобы найти карманников, тогда вам нужны правильные данные, то есть место, где его видели в последний раз, его контактные данные и т. д. идет с машинным обучением, мы должны предоставить ему корректные данные, чтобы он предсказывал правильный результат, машина учится на предыдущих данных и делает прогнозы на основе предыдущих данных.

4. Типы машинного обучения

Существует три основных категории машинного обучения:

· Контролируемое обучение: машина учится на помеченных (предоставленных) данных. Обычно данные маркируются людьми.

· Неконтролируемое обучение: машина учится на неразмеченных данных. Это означает, что машине не дается «правильный» ответ для обучения, но машина, надеюсь, должна найти шаблоны из данных, чтобы дать ответ.

· Обучение с подкреплением: машина ошибается и учится на данных.

Контролируемое машинное обучение

· Контролируемое обучение является наиболее распространенным и изученным типом обучения, потому что легче обучить машину обучению с помеченными данными, чем с неразмеченными данными. В зависимости от того, что вы хотите предсказать, контролируемое обучение можно использовать для решения двух типов задач: регрессия или классификация.

· Проблема регрессии:

o Если вы хотите спрогнозировать непрерывные значения, например попытаться спрогнозировать стоимость дома или погоду на улице в градусах, вы бы использовали регрессию. Этот тип задач не имеет определенного ограничения значения, потому что значение может быть любым числом без каких-либо ограничений.

· Проблема классификации:

o Если вас интересует такая задача, как «будет ли завтра дождь», то это проблема классификации, поскольку вы пытаетесь классифицировать ответ на двеконкретные категории: да или нет (в этом случае ответ на вопрос выше — да). Это также называется проблемой бинарной классификации.

Обучение без учителя

При неконтролируемом обучении цель машины состоит в том, чтобы обнаружить закономерности в данных и сгруппировать их в соответствии с ними. Роль человека состоит в том, чтобы передать данные машине и сказать им найти закономерность. Это зависит от нас, что мы хотим сгруппировать, неконтролируемое обучение может сгруппировать данные вместе:

A.кластеризация

Б. ассоциация

КЛАСТРИЗАЦИЯ

· Неконтролируемое обучение пытается решить эту проблему путем поиска сходства в данных. Если есть общий кластер или группа, алгоритм классифицирует их в определенной форме. Примером этого является то, что когда мы получаем почту в Gmail, машина автоматически идентифицирует эту почту как СПАМ или HAM, а затем перемещает СПАМ-письма в папку нежелательной почты/спама. Это пример кластеризации

Генеративные модели

· Генеративная модель может генерировать новые фотографии животных, которые выглядят как настоящие животные, а дискриминативная модель может отличить собаку от кошки. GAN — это всего лишь один из видов генеративной модели.

· Генеративная модель включает в себя распределение самих данных и сообщает вам, насколько вероятен данный пример. Например, модели, которые предсказывают следующее слово в последовательности, обычно являются генеративными моделями (обычно намного проще, чем GAN), потому что они могут присваивать вероятность последовательности слов.

ПОМОЩЬ ОБУЧЕНИЯ

· Этот тип машинного обучения требует использования системы вознаграждения/наказания. Цель состоит в том, чтобы вознаграждать машину, когда она учится правильно, и наказывать машину, когда она учится неправильно, процесс итеративный, он продолжает учиться.

· Пример: обучение модели обучению игре в шахматы, amazon echo (Alexa).

ПОЛУКОНДИЦИОНЕРНОЕ ОБУЧЕНИЕ

Полууправляемое обучение находится между моделями неконтролируемого и обучения с учителем. Задача обучения с полуучителем начинается с ряда помеченных точек данных, а также некоторых немаркированных данных. Основная цель полуконтролируемого обучения состоит в том, чтобы идентифицировать немаркированный набор данных на основе предоставленного набора помеченной информации.

Пример полуконтролируемого обучения: -

Анализ речи: это популярный пример обучения с полуучителем. способен предсказывать немаркированные музыкальные файлы на основе помеченных.

ТЕРМИНОЛОГИЯ МАШИННОГО ОБУЧЕНИЯ

1. Модель:

· Модель машинного обучения — это файл, обученный распознавать определенные типы шаблонов. Когда вы обучаете модель на наборе данных, предоставляя ей алгоритм, который она может использовать для рассуждений и извлечения уроков из этих данных.

· После того, как вы обучили модель, вы можете использовать ее для анализа данных, которых она раньше не видела, и делать прогнозы относительно этих данных. Например, допустим, вы хотите создать приложение, которое может распознавать эмоции пользователя на основе его выражения лица. Вы можете обучить модель, предоставив ей изображения лиц, каждое из которых помечено определенной эмоцией, а затем вы можете использовать эту модель в приложении, которое может распознавать любую эмоцию пользователя.

2. Особенность:

· Особенность — это измеримое свойство объекта, который вы пытаетесь проанализировать. Это строительные блоки наборов данных. Качество функций в вашем наборе данных оказывает большое влияние на качество информации, которую вы получите, используя этот набор данных для машинного обучения.

3. Цель:

· Переменная target набора данных – это функция набора данных, о которой вы хотите получить более глубокое представление. Контролируемый алгоритм машинного обучения использует исторические данные для изучения закономерностей и выявления взаимосвязей между другими функциями вашего набора данных и целью.

4. Прогноз:

· Предположим, нам дан набор данных, и с помощью этих точек данных мы можем определить закономерность и предсказать результат. Этот процесс называется предсказанием.

5. Обучение

· Всякий раз, когда у вас есть набор данных, первое, что вы делаете, это «исследовательский анализ данных», а затем вы делите набор данных на 2 части: «ОБУЧЕНИЕ И ТЕСТИРОВАНИЕ» набор данных. Мы обучаем нашу модель на тестовом наборе данных, то есть применяем модель машинного обучения и прогнозируем результат, это называется обучением. После обучения нашей модели мы тестируем нашу модель на «тестовом» наборе данных и наблюдаем, что результат почти аналогичен набору обучающих данных.

автор: Деванш Шривастава

(https://www.linkedin.com/in/devansh-srivastava-3669ba190/)