Машинное обучение — это приложение ИИ (искусственного интеллекта), которое дает системам возможность учиться и совершенствоваться автоматически с опытом без явного программирования. ML фокусируется на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения.
Процесс обучения начинается с наблюдений или данных, таких как примеры, непосредственный опыт или инструкции, для поиска закономерностей в данных и принимать более эффективные решения в будущем на основе предоставленных примеров. Основная цель состоит в том, чтобы позволить компьютерам автоматически обучаться без вмешательства или помощи человека и соответствующим образом адаптировать действия.
Однако при использовании классических алгоритмов машинного обучения текст рассматривается как последовательность ключевых слов; напротив, подход, основанный на семантическом анализе, имитирует человеческую способность понимать смысл текста.

Эволюция машинного обучения

Благодаря новым информационным технологиям машинное обучение сегодня не похоже на машинное обучение в прошлом. Он возник из распознавания образов и теории, согласно которой компьютеры могут обучаться, не будучи запрограммированными для выполнения конкретных задач; исследователи, интересующиеся искусственным интеллектом, хотели узнать, могут ли компьютеры учиться на данных. Итеративный аспект машинного обучения важен, потому что по мере того, как модели подвергаются воздействию новых данных, их можно адаптировать независимо. Они учатся на предыдущих расчетах принимать надежные и воспроизводимые решения и результаты. Эта наука не нова, но она получила новый импульс.
Хотя многие алгоритмы машинного обучения существуют уже давно, возможность автоматически применять сложные математические вычисления к большим данным снова и снова в все более быстрый темп является недавним развитием. Вот несколько примеров крупномасштабных рекламных приложений машинного обучения, с которыми вы, возможно, знакомы:
1. Суть машинного обучения: беспилотные автомобили Google.
2. Приложение машинного обучения для повседневной жизни: онлайн предложения рекомендаций, такие как Amazon и Netflix
3. Машинное обучение в сочетании с созданием лингвистических правил: знание того, что клиенты говорят о вас в социальных сетях (например, Twitter)
4. Важное использование машинного обучения : перехват мошенничества

ТИПЫ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ

Алгоритмы контролируемого машинного обучения

Этот тип алгоритма машинного обучения может применять то, что он узнал в прошлом, к новым данным, используя помеченные примеры для прогнозирования будущих событий. Алгоритм обучения создает предполагаемую функцию для прогнозирования выходных значений путем анализа известного набора обучающих данных. Система может предоставить цели для любой новой записи после достаточной подготовки. Алгоритм обучения также может сравнивать результат с ожидаемым правильным результатом и находить ошибки для соответствующей модификации модели.

Неконтролируемые алгоритмы машинного обучения

Они используются, когда информация, используемая для обучения, не классифицируется и не маркируется. Неконтролируемое обучение изучает, как методы могут вывести функцию для описания скрытой структуры из немаркированных данных. Система не находит правильный результат, но исследует данные и может делать выводы из наборов данных, чтобы описать скрытые структуры неразмеченных данных.

Полууправляемые алгоритмы машинного обучения

Они находятся где-то между контролируемым и неконтролируемым обучением. Они используют размеченные и неразмеченные данные для обучения, как правило, небольшое количество размеченных данных и много неразмеченных данных. Системы, использующие этот метод, могут значительно повысить точность обучения. Полууправляемое обучение обычно выбирается, когда полученные размеченные данные требуют квалифицированных и соответствующих ресурсов для обучения/обучения. В противном случае получение неразмеченных данных не требует дополнительных ресурсов.

Алгоритмы машинного обучения с подкреплением

Этот тип алгоритма машинного обучения взаимодействует с вашей средой, производя действия и обнаруживая ошибки или вознаграждения. Поиск методом проб и ошибок и отложенное вознаграждение являются наиболее важными особенностями обучения с подкреплением. Этот метод позволяет машинам и программным агентам автоматически определять оптимальное поведение в определенном контексте, чтобы максимизировать свою производительность.
Простая обратная связь для вознаграждения необходима, чтобы информировать агента о лучшем действии; это называется сигналом подкрепления.

Машинное обучение позволяет анализировать большие объемы данных. Хотя он обычно дает более быстрые и точные результаты при определении прибыльных возможностей или опасных рисков, он также может потребовать дополнительного времени и ресурсов для надлежащего обучения. Сочетание машинного обучения с искусственным интеллектом и когнитивными технологиями может сделать вас еще более эффективным в обработке больших объемов информации.

Почему машинное обучение важно?

Возобновление интереса к машинному обучению обусловлено теми же факторами, которые сделали анализ данных более популярным, чем когда-либо. Такие вещи, как увеличение объема и разнообразия доступных данных, более дешевые и мощные вычисления и доступное хранилище данных.
Все это означает, что вы можете быстро и автоматически создавать модели, которые могут анализировать более крупные и сложные данные и доставлять их быстрее и больше. точные результаты, даже в масштабе. А создавая точные модели, организация с большей вероятностью выявит выгодные возможности или избежит неизвестных рисков.

Что нужно для создания хорошей системы машинного обучения?
Алгоритмы: базовые и продвинутые.
Автоматизация и итерационные процессы.
Навыки подготовки данных.
Ансамблевое моделирование.
Масштабируемость. .

НЕКОТОРЫЙ АЛГОРИТМ МАШИННОГО ОБУЧЕНИЯ

Наивная байесовская классификация
Поддерживает векторные машины (SVM)
Деревья решений
Регрессия

Некоторые часто используемые термины машинного обучения

Выбросы
Это точки данных, которые значительно отличаются от других наблюдений и могут быть вредными для модели, поскольку они могут привести к менее точным моделям.
Кластеризация< br /> Кластеризация — это неконтролируемая задача машинного обучения, которая включает в себя разделение точек данных на группы таким образом, чтобы похожие точки данных находились в одной группе.
Выбор признаков
Это процесс сокращение количества переменных за счет определения наиболее важных характеристик ваших данных с помощью человеческой интуиции и алгоритмов.

Масштабирование функций

Это метод предварительной обработки, используемый для нормализации характеристик данных.

Переоснащение

Когда большой объем данных управляет моделью машинного обучения, она, как правило, учится на шуме и неточном вводе данных. В этом случае модель не может правильно охарактеризовать данные.

Прогноз

Результат, который дает модель машинного обучения после ввода данных и обучения.

Особенность

Функция — это свойство или измеримый параметр набора данных.

Подгонка.

Это сценарий, в котором модель не может расшифровать основную тенденцию во входных данных. Это разрушает точность модели машинного обучения. Проще говоря, модель или алгоритм плохо соответствуют данным.

Цель (метка)

Значение, которое должна предсказывать модель машинного обучения, называется целью или меткой.

Обучение

Алгоритм принимает в качестве входных данных набор данных, называемый обучающими данными. Алгоритм обучения находит закономерности во входных данных и обучает закономерность ожидаемым (целевым) результатам. Результатом процесса обучения является модель машинного обучения.

Вектор признаков

Это набор из нескольких цифровых ресурсов. Мы используем его в качестве входных данных для модели машинного обучения в целях обучения и прогнозирования.

Модель

Модель машинного обучения, также известная как гипотеза, представляет собой математическое представление реального процесса. Алгоритм машинного обучения, связанный с обучающими данными, создает модель машинного обучения.