Этот вопрос очень часто задают начинающие специалисты по машинному обучению, которые стремятся стать инженером машинного обучения, способным решить любую проблему с помощью своего меча машинного обучения.

Прежде всего, я хочу сказать, что не все проблемы должны решаться практикой машинного обучения. Мы должны сосредоточиться на самом простом и легком решении, и не имеет значения, какая практика помогла решить эту проблему. Предположим, что если есть проблема, которую можно решить с помощью алгебраических уравнений, это не лучший сценарий для использования методов ML, поэтому подумайте, прежде чем переходить к тому, как я могу использовать ML здесь?

В этом посте я собираюсь поделиться несколькими основными шагами, что совсем не ново, но я использую их для всех проблем (сосредоточившись здесь на проблемах ML), с которыми я сталкивался в своей повседневной работе.

Давайте сначала рассмотрим приведенный ниже поток, а затем обсудим детали в деталях.

Я лично следую этому потоку, чтобы решить проблему ML, и я клянусь, этот поток никогда не бросал меня. Итак, давайте разберемся в деталях —

а. Осмыслите проблему:

Что я имею в виду? На самом деле, это человеческая склонность хвататься за оружие, если они знают, что надели пуленепробиваемый жилет, не анализируя, с каким оружием они столкнулись. Поэтому всегда сначала анализируйте проблему, прежде чем переходить к решению. Прочитайте задачу, повторите ее 2-3 раза хотя бы, чтобы закрепить ее.

б. Определите алгоритм машинного обучения и преимущества:

Каждую проблему можно решить с помощью некоторого алгоритма (не говоря уже о точности), поэтому начните с него. Если не знаете, начните со случайного леса. Определите достоинства, по которым вы собираетесь судить о своей модели.

в. Псевдокод проблемы:

Просто спроектируйте необработанную структуру кода, как вы собираетесь выполнять все шаги для решения этой проблемы.

д. Сбор и очистка данных:

Начиная с этих шагов, мы собираемся фактически работать над проблемой, до сих пор мы наблюдали только за основными моментами матча, и вы должны знать, что очистка данных и разработка функций занимают большую часть общего времени для решения проблемы.

e. Разработка функций:

Этот шаг очень важен в вашем путешествии до сих пор. Какой минимум столбцов требуется для оптимального решения проблемы или какой вид предварительной обработки требуется. Возможно, вам придется вернуться к этому шагу назад и вперед, когда вы будете работать над своей моделью. После обработки функций разделите данные на 3 части: данные обучения, тестирования и проверки. Не забудьте рандомизировать данные в разбивке, чтобы распределить все виды данных по частям.

ж. Обучение и настройка модели:

Теперь приступайте к обучению модели и настройте ее на основе достоинств модели, которые вы определили на 2-м шаге. Здесь вы можете передумать использовать другой алгоритм машинного обучения или преимущества, для которых вам, возможно, придется вернуться к шагу разработки функций.

г. Проверка модели:

Как только модель будет готова, проверьте ее по данным проверки, если размер данных небольшой, вы также можете выбрать метод перекрестной проверки. Основываясь на результатах проверки, вы получите ответ, если вам нужно пересмотреть алгоритм/достоинства модели и т. д.

ч. Развертывание модели:

Если вы удовлетворены результатом всех вышеперечисленных шагов, вы можете продолжить развертывание модели. Это может быть на локальном сервере облака, не забудьте преобразовать модель в соответствующий облачный формат.

Я надеюсь, что этот пост даст вам представление о том, как поступать с любой проблемой ML. Дайте мне знать в поле для комментариев.

до тех пор ... Счастливого обучения !!!

Спасибо
Атул Сингх
www.datagenx.net