Машинное обучение позволяет компьютерам решать задачи, которые до сих пор выполнялись только людьми.

Машинное обучение - от вождения автомобилей до перевода речи - резко расширяет возможности искусственного интеллекта, помогая программному обеспечению разобраться в беспорядочном и непредсказуемом реальном мире.

Но что такое машинное обучение и что делает возможным нынешний бум машинного обучения?

Что такое машинное обучение?

На очень высоком уровне машинное обучение - это процесс, позволяющий машинной системе понять, как делать точные прогнозы при вводе данных.

Эти прогнозы могут отвечать, является ли фрукт на фотографии манго или яблоком, замечать людей, переходящих дорогу перед беспилотным автомобилем, является ли электронное письмо спамом, или распознавать речь достаточно точно, чтобы создавать подписи для YouTube видео.

Большинство из нас не подозревают, что уже ежедневно взаимодействуем с машинным обучением. Каждый раз, когда мы что-то гуглим, слушаем песню или даже делаем фото, машинное обучение становится частью его движка, постоянно учится и совершенствуется при каждом взаимодействии.

Ключевое отличие от традиционного компьютерного программного обеспечения состоит в том, что разработчик-человек не написал код, который инструктирует систему, как отличить манго от яблока.

Вместо этого модель машинного обучения научили надежно различать фрукты, обучаясь на большом количестве данных, в этом случае, вероятно, на огромном количестве изображений, помеченных как содержащие манго или яблоко.

Мы тонем в информации и жаждем знаний - Джон Нейсбитт

В последние годы произошел взрыв огромного количества данных. Эта масса данных бесполезна, если мы не проанализируем ее и не извлечем из нее что-то продуктивное. Методы машинного обучения используются для автоматического поиска ценных базовых закономерностей в сложных данных, которые в противном случае нам было бы сложно обнаружить. Скрытые закономерности и знания о проблеме могут быть использованы для прогнозирования будущих событий и принятия всевозможных сложных решений.

Традиционно разработка программного обеспечения объединяет созданные человеком правила с данными, чтобы найти ответы на проблемы. Вместо этого машинное обучение использует данные и ответы, чтобы обнаружить правила, лежащие в основе проблемы.

Терминология, связанная с машинным обучением

  • Набор данных: набор примеров данных, которые содержат функции, важные для решения проблемы.
  • Возможности: важные данные, которые помогают нам понять проблему. Они передаются в алгоритм машинного обучения, чтобы помочь ему в обучении.
  • Модель: представление (внутренняя модель) явления, которому научился алгоритм машинного обучения. Он узнает это из данных, которые он показывает во время обучения. Модель - это результат, который вы получаете после обучения алгоритма. Например, алгоритм дерева решений будет обучен и даст модель дерева решений.

Процесс

  1. Сбор данных. Соберите данные, на основе которых алгоритм будет учиться.
  2. Подготовка данных: отформатируйте данные и придайте им оптимальный формат, извлекая важные функции и выполняя уменьшение размерности.
  3. Обучение: это также известно как этап подбора. На нем алгоритм машинного обучения фактически обучается на основе собранных и подготовленных данных.
  4. Оценка. Протестируйте набор данных и, следовательно, модель, чтобы увидеть, насколько хорошо она работает.
  5. Улучшение. Дальнейшее улучшение модели для повышения ее производительности.

Подходы к машинному обучению

Теорема об отсутствии бесплатного обеда известна в машинном обучении. В нем говорится, что не существует единого алгоритма, который бы хорошо работал для всех задач. Каждая задача имеет свои особенности и требования.

Есть много подходов, которые можно использовать при проведении машинного обучения. Обучение с учителем и обучение без учителя - хорошо зарекомендовавшие себя и наиболее часто используемые подходы. Полу-контролируемое обучение и обучение с подкреплением являются более новыми и сложными, но уже показали впечатляющие результаты.

Что такое контролируемое обучение?

Этот подход в основном обучает машины на примерах, которые называются набором данных.

Во время обучения контролируемому обучению системы подвергаются воздействию большого количества помеченных данных, например изображений рукописных цифр с аннотациями, указывающими, какому числу они соответствуют. При наличии достаточного количества примеров система контролируемого обучения научится распознавать кластеры пикселей и формы, связанные с каждым числом, и в конечном итоге сможет распознавать рукописные числа, способные надежно различать числа 9 и 4 или 6 и 8.

Однако для обучения этих систем обычно требуются огромные объемы помеченных данных, при этом некоторым системам необходимо использовать миллионы примеров, чтобы справиться с задачей.

Что такое обучение без учителя?

Напротив, алгоритмы задач неконтролируемого обучения с идентификацией закономерностей в данных, пытающиеся выявить сходства, которые разделяют эти данные на категории.

Примером может служить Airbnb, объединяющий в кластеры дома, доступные для аренды по районам, или Новости Google, объединяющие вместе рассказы на похожие темы каждый день.

Алгоритм не предназначен для выделения определенных типов данных, он просто ищет данные, которые можно сгруппировать по их сходству, или выделять аномалии.

Полу-контролируемое обучение

Важность огромных наборов помеченных данных для обучения систем машинного обучения может со временем уменьшиться из-за роста частично контролируемого обучения.

Как следует из названия, подход сочетает в себе обучение с учителем и обучение без учителя. Этот метод основан на использовании небольшого количества помеченных данных и большого количества немаркированных данных для обучения систем. Помеченные данные используются для частичного обучения модели машинного обучения, а затем эта частично обученная модель используется для маркировки немаркированных данных; этот процесс называется псевдо-маркировкой. Затем модель обучается на полученном сочетании помеченных и псевдо-помеченных данных.

Обучение с подкреплением

Это менее распространено и намного сложнее, но дает невероятные результаты. Он не использует ярлыки как таковые, а вместо этого использует награды для обучения.

Если вы знакомы с психологией, вы наверняка слышали об обучении с подкреплением. Если нет, то вы уже знаете эту концепцию из того, как мы учимся в повседневной жизни. При таком подходе периодические положительные и отрицательные отзывы используются для усиления поведения.

Это очень похоже на то, как мы, люди, учимся. На протяжении всей жизни мы получаем положительные и отрицательные сигналы и постоянно учимся на них. Когда происходит что-то хорошее, нейроны в нашем мозгу выделяют положительные нейротрансмиттеры, такие как дофамин, что заставляет нас чувствовать себя хорошо, и мы с большей вероятностью повторим это конкретное действие. Это приближает машинное обучение к стилю обучения, используемому людьми.

Приложения машинного обучения

Ценность технологии машинного обучения признана компаниями из нескольких отраслей, которые имеют дело с огромными объемами данных. Используя идеи, полученные на основе этих данных, компании могут эффективно контролировать расходы, а также получать преимущество над своими конкурентами. Вот как некоторые секторы / домены реализуют машинное обучение -

Финансовые услуги

Компании финансового сектора могут выявлять ключевые идеи в финансовых данных, а также предотвращать любые случаи финансового мошенничества с помощью технологии машинного обучения. Технология также используется для определения возможностей для инвестиций и торговли. Использование кибер-наблюдения помогает выявлять тех лиц или организации, которые подвержены финансовым рискам, и вовремя принимать необходимые меры для предотвращения мошенничества.

Маркетинг и продажи

Компании используют технологию машинного обучения для анализа истории покупок своих клиентов и составления индивидуальных рекомендаций по продуктам для их следующей покупки. За этой способностью собирать, анализировать и использовать данные о клиентах для обеспечения персонализированного покупательского опыта - будущее продаж и маркетинга.

Правительство

Государственные учреждения, такие как коммунальные предприятия и общественная безопасность, имеют особую потребность в Ml, поскольку у них есть несколько источников данных, которые можно добыть для выявления полезных шаблонов и идей. Например, данные датчиков могут быть проанализированы для определения способов минимизации затрат и повышения эффективности. Кроме того, ML также можно использовать для минимизации краж личных данных и обнаружения мошенничества.

Здравоохранение

С появлением носимых датчиков и устройств, которые используют данные для доступа к состоянию здоровья пациента в режиме реального времени, машинное обучение становится быстрорастущей тенденцией в здравоохранении. Носимые датчики предоставляют информацию о пациенте в режиме реального времени, такую ​​как общее состояние здоровья, сердцебиение, артериальное давление и другие жизненно важные параметры. Врачи и медицинские эксперты могут использовать эту информацию для анализа состояния здоровья человека, построения модели из истории болезни пациента и прогнозирования возникновения каких-либо заболеваний в будущем. Эта технология также позволяет медицинским экспертам анализировать данные для выявления тенденций, которые способствуют более точной диагностике и лечению.

Транспорт

Основываясь на истории путешествий и схеме передвижения по различным маршрутам, машинное обучение может помочь транспортным компаниям предсказать потенциальные проблемы, которые могут возникнуть на определенных маршрутах, и, соответственно, посоветовать своим клиентам выбрать другой маршрут. Транспортные фирмы и службы доставки все чаще используют технологии машинного обучения для анализа и моделирования данных, чтобы принимать обоснованные решения и помогать своим клиентам принимать разумные решения во время путешествий.

Это все, что касается машинного обучения! Следите за тем, чтобы в ближайшее время появилось больше блогов, в которых будут более подробно освещены определенные темы.