Обзор его приложений и его значение в современном мире

Машинное обучение было определено как «область исследования, которая дает компьютерам возможность учиться без явного программирования» — Артур Сэмюэл, 1959 г.

Машинное обучение также можно описать как подмножество искусственного интеллекта и компьютерных наук, которое использует данные и алгоритмы для имитации того, как люди учатся, и повышения его точности. Компании управляют принятием решений, используя алгоритмы, которые обучены делать классификации или прогнозы с использованием статистических методов.

Одним из первых применений машинного обучения было обнаружение спама в электронных письмах, но с годами оно развивалось и используется различными способами, такими как классификация изображений с использованием компьютерного зрения, сегментация клиентов для рекомендательных систем, обнаружение аномалий (обнаружение мошенничества с кредитными картами). ) и анализ настроений в тексте и т. д.

Существуют разные способы классификации проблем машинного обучения:

  • В зависимости от количества контроля, который они получают во время обучения (обучение с учителем, обучение без учителя, обучение с частичным учителем и обучение с подкреплением)
  • Могут ли они обучаться постепенно из потока входящих данных (онлайн или пакетное обучение)
  • Как системы могут обобщать, т. Е. Может ли система делать хорошие прогнозы на примерах, которые она никогда раньше не видела (обучение на основе экземпляров и обучение на основе моделей)

Эти критерии не являются исключительными, их можно комбинировать как угодно. Например, рекомендательная система Netflix может обучаться на лету, используя данные о прошлых фильмах, просмотренных вами и другими пользователями Netflix, чтобы передавать данные нейронным сетям и заставлять их выводить следующий вероятный фильм, который вы бы посмотрели; это делает его онлайн-системой обучения без присмотра.

Не волнуйтесь, если все эти концепции поначалу покажутся вам странными, вы можете узнать о них больше в следующих двух постах.

Быстрый рост собираемых данных стал ключевым фактором популярности и роста машинного обучения на протяжении многих лет. Выбор используемой модели ML зависит от многих факторов, таких как размер обучающих данных, количество функций, которые имеет набор данных, и является ли это проблемой классификации или регрессии.

В машинном обучении основная задача состоит в том, чтобы выбрать алгоритм обучения, обучить его некоторым данным и использовать его для классификации/предсказания будущих экземпляров данных. Для этого необходимо разделить данные, используемые для обучения, и данные, используемые для тестирования, измерения и проверки точности модели.

Основными проблемами, с которыми сталкиваются при построении моделей ML, являются «плохие данные», то есть данные низкого качества, недостаточное количество данных и данные, нерепрезентативные для новых случаев, и «плохие алгоритмы», то есть переобучение и недообучение обучающих данных.

Алгоритмы машинного обучения обычно создаются с использованием фреймворков, упрощающих и ускоряющих построение моделей. Scikit-learn, TensorFlow и PyTorch — одни из самых распространенных фреймворков.

Наконец, я не могу переоценить важность знания предметной области при решении задач машинного обучения, поскольку оно играет большую роль в результате. Знание того, какие функции использовать для модели, помогает повысить ее точность. Например, если вас попросят построить модель, классифицирующую, является ли клетка в организме раковой, вам понадобится онколог, чтобы определить характер рака, особенно при сборе данных.

В ближайшие несколько дней я буду писать о различных темах машинного обучения и о том, как они применяются в нашей повседневной жизни. Эти темы будут охватывать вводные концепции для более сложных концепций, таких как глубокое обучение. Так что, если вы энтузиаст машинного обучения, пристегнитесь и следите за обновлениями…

Независимо от того, являетесь ли вы новичком, желающим узнать о машинном обучении, или опытным специалистом по данным, стремящимся быть в курсе последних событий, я надеюсь, что вы найдете здесь что-то интересное. Ваши комментарии и мнения приветствуются, поскольку в конечном итоге мы учимся друг у друга.