4 соображения при разработке проекта машинного обучения

Я уверен, что, живя в эпоху цифровых технологий, большинство населения знает об определенных новых тенденциях в наших смартфонах и веб-сайтах электронной коммерции. Если вы столкнулись с функцией распознавания лиц в своих мобильных телефонах для разблокировки телефона, вы не чужды машинному обучению; если вы сталкивались с рекомендациями при просмотре веб-сайтов электронной коммерции, вы, должно быть, пытались понять, как это делается, и, чтобы пролить свет, они называются рекомендательными системами, еще одним приложением машинного обучения? Если вы когда-нибудь играли в шахматы с компьютером и терпели безжалостное поражение, вы, должно быть, пытались догадаться, как компьютер может знать, что играть дальше, и взломать оболочку, это приложение искусственного интеллекта? Если вам все это знакомо, позвольте напомнить, что все вышеперечисленное можно прямо или косвенно отнести к машинному обучению.

Теперь позвольте мне ответить на самый неизбежный вопрос всех времен: что такое машинное обучение? Машинное обучение дает агенту возможность учиться, в нашем случае это вычислительный чип, встроенный в наши смартфоны, который делает свое дело, в то время как в рекомендациях по электронной коммерции это серверы, которые могут выполнять это действие. Глядя на все эти практические приложения, мы все должны согласиться с тем, что машинное обучение больше не является модным словом в технической сфере, а является новой реальностью, которая является осязаемой, программируемой и помогает в достижении высококачественных результатов для различных видов бизнеса.

Машинное обучение, однако, не является новой концепцией, а восходит к 1970-м годам, когда ученые-компьютерщики пытались решить некоторые из неразрешимых проблем с помощью компьютеров. Но это их никуда не привело, так как всем алгоритмам машинного обучения требуется огромное количество данных для получения результатов. Таким образом, неудивительно, что старые и надежные алгоритмы машинного обучения стали более важными, чем когда-либо, в нынешнюю цифровую эпоху, когда правят данные.

Однако загвоздка в том, что все приложения машинного обучения сильно зависят от различных факторов, которые можно разделить на четыре класса. Для разработки очень сложных моделей, дающих точные результаты, ниже приведены классы соображений, которые разработчики должны принимать во внимание.

Соображение №1: качество данных

Одна из самых фундаментальных проверок, которую должны проверить инженеры по машинному обучению, — это высокое качество данных или нет. Это можно определить с точки зрения выбросов, содержащихся в наборе данных, количества данных, отсутствующих в наборе данных, асимметрии данных в сторону определенной стороны и дисперсии данных. Чем выше качество данных, тем выше точность модели машинного обучения, которая изучает эти данные. Чем выше точность, тем выше производительность и, следовательно, выше добавленная стоимость для бизнес-сценария.

Соображение №2: сосредоточьтесь на результате

Поскольку наборы данных, которые обычно используются для обучения данных, содержат много переменных, в них очень легко заблудиться. Когда количество независимых переменных в наборе данных велико, количество возможных результатов из набора данных также резко возрастает. Это означает, что неопытному инженеру по машинному обучению очень легко запрограммировать модель, чтобы предсказать другой результат, когда бизнес нуждается в чем-то другом. Таким образом, ориентация на результат должна сохраняться всегда с самого начала и до конца этапов проекта машинного обучения.

Соображение №3: разнообразие данных

На точность модели машинного обучения сильно влияет разнообразие данных, с которыми она работает, пока она изучает данные на этапе обучения. Это связано с тем, что чем разнообразнее данные, тем лучшие методы усреднения модель может использовать для более точной оценки результатов. Таким образом, запуск вашей модели на различных данных из различных источников, имеющих одинаковую природу зависимых и независимых переменных, позволяет создать более сложную модель машинного обучения.

Соображение № 4: человеческие предубеждения

Это лежит в основе всех моделей машинного обучения. Модели машинного обучения строятся на наборе данных, которые, в свою очередь, генерируются системами, запрограммированными людьми, и, таким образом, по умолчанию в самом начале всего процесса вводится человеческий фактор. Инженеры по машинному обучению очень хорошо знают об этом артефакте и поэтому всегда стараются свести к минимуму человеческий фактор в системе, избегая его на последующих этапах проекта.

Следовательно, проекты машинного обучения, хотя и очень прибыльные, а иногда и очень творческие, дающие нам очень хороший результат, также зависят от определенных вещей. Мы рассмотрели четыре основных класса, от которых зависят модели машинного обучения. Это была только верхушка айсберга; если вы хотите больше узнать об этой теме и понять масштабы технологий в цифровом пространстве, ознакомьтесь с Что такое машинное обучение в 2020 году? Если эта статья заинтересовала вас в этой области, ознакомьтесь с курсами Машинное обучение с R и Машинное обучение с Python от Генри Харвина.

4 соображения при разработке проекта машинного обучения

Соображение №1: качество данных

Соображение №2: сосредоточьтесь на результате

Соображение №3: разнообразие данных

Соображение № 4: человеческие предубеждения

Вопросы по теме