Введение в машинное обучение

Обзор его приложений и его значение в современном мире

Машинное обучение было определено как «область исследования, которая дает компьютерам возможность учиться без явного программирования» — Артур Сэмюэл, 1959 г.

Машинное обучение также можно описать как подмножество искусственного интеллекта и компьютерных наук, которое использует данные и алгоритмы для имитации того, как люди учатся, и повышения его точности. Компании управляют принятием решений, используя алгоритмы, которые обучены делать классификации или прогнозы с использованием статистических методов.

Одним из первых применений машинного обучения было обнаружение спама в электронных письмах, но с годами оно развивалось и используется различными способами, такими как классификация изображений с использованием компьютерного зрения, сегментация клиентов для рекомендательных систем, обнаружение аномалий (обнаружение мошенничества с кредитными картами). ) и анализ настроений в тексте и т. д.

Существуют разные способы классификации проблем машинного обучения:

В зависимости от количества контроля, который они получают во время обучения (обучение с учителем, обучение без учителя, обучение с частичным учителем и обучение с подкреплением)
Могут ли они обучаться постепенно из потока входящих данных (онлайн или пакетное обучение)
Как системы могут обобщать, т. Е. Может ли система делать хорошие прогнозы на примерах, которые она никогда раньше не видела (обучение на основе экземпляров и обучение на основе моделей)

Эти критерии не являются исключительными, их можно комбинировать как угодно. Например, рекомендательная система Netflix может обучаться на лету, используя данные о прошлых фильмах, просмотренных вами и другими пользователями Netflix, чтобы передавать данные нейронным сетям и заставлять их выводить следующий вероятный фильм, который вы бы посмотрели; это делает его онлайн-системой обучения без присмотра.

Не волнуйтесь, если все эти концепции поначалу покажутся вам странными, вы можете узнать о них больше в следующих двух постах.

Быстрый рост собираемых данных стал ключевым фактором популярности и роста машинного обучения на протяжении многих лет. Выбор используемой модели ML зависит от многих факторов, таких как размер обучающих данных, количество функций, которые имеет набор данных, и является ли это проблемой классификации или регрессии.

В машинном обучении основная задача состоит в том, чтобы выбрать алгоритм обучения, обучить его некоторым данным и использовать его для классификации/предсказания будущих экземпляров данных. Для этого необходимо разделить данные, используемые для обучения, и данные, используемые для тестирования, измерения и проверки точности модели.

Основными проблемами, с которыми сталкиваются при построении моделей ML, являются «плохие данные», то есть данные низкого качества, недостаточное количество данных и данные, нерепрезентативные для новых случаев, и «плохие алгоритмы», то есть переобучение и недообучение обучающих данных.

Алгоритмы машинного обучения обычно создаются с использованием фреймворков, упрощающих и ускоряющих построение моделей. Scikit-learn, TensorFlow и PyTorch — одни из самых распространенных фреймворков.

Наконец, я не могу переоценить важность знания предметной области при решении задач машинного обучения, поскольку оно играет большую роль в результате. Знание того, какие функции использовать для модели, помогает повысить ее точность. Например, если вас попросят построить модель, классифицирующую, является ли клетка в организме раковой, вам понадобится онколог, чтобы определить характер рака, особенно при сборе данных.

В ближайшие несколько дней я буду писать о различных темах машинного обучения и о том, как они применяются в нашей повседневной жизни. Эти темы будут охватывать вводные концепции для более сложных концепций, таких как глубокое обучение. Так что, если вы энтузиаст машинного обучения, пристегнитесь и следите за обновлениями…

Независимо от того, являетесь ли вы новичком, желающим узнать о машинном обучении, или опытным специалистом по данным, стремящимся быть в курсе последних событий, я надеюсь, что вы найдете здесь что-то интересное. Ваши комментарии и мнения приветствуются, поскольку в конечном итоге мы учимся друг у друга.

Введение в машинное обучение

Обзор его приложений и его значение в современном мире

Вопросы по теме