Здравствуйте, меня зовут Локеш Сони, и это мой первый пост из множества предстоящих постов о практических рекомендациях, хитростях, сравнениях и передовых методах работы. По профессии я инженер по компьютерному зрению и умею решать проблемы наизусть. Недавно я разговаривал с другом, который отличный разработчик и хотел изучить машинное обучение как одну из самых крутых вещей, происходящих вокруг. После долгих дискуссий о том, с чего начать, я дал ему совет по интеграции машинного обучения в его проекты, не зная его. Да, именно на этом я и остановлюсь в этой статье. Это должно было быть ML для всех, но поскольку я буду брать пример классификации изображений, отсюда и название.

Вот несколько способов использования машинного обучения из разных источников Software Development Track.

Google Cloud Vision API

Vision API (наряду с другими API машинного обучения) от Google Cloud предлагает мощные модели машинного обучения через REST и RPC API. Он может выполнять множество задач, таких как классификация ваших изображений по миллионам предопределенных категорий, обнаружение объектов и лиц, чтение печатного и рукописного текста (ДА !!) и т. Д. Это для разработчиков, которые еще не знакомы с ML. с его помощью можно создавать мощные приложения.

Совет от профессионала: если вы хотите разделить пиццу на гамбургеры или что-то общее, то это ваш парень, который сделает эту работу с очень меньшими затратами и без усилий!

Вы можете попробовать демо по этой ссылке и обратиться к документации для дальнейшей интеграции с вашим приложением.



Кроме того, цены вполне разумные!



AutoML Vision

Хотя многое из этого можно сделать с помощью Vision API, вы можете столкнуться с требованием различать свою собаку и собаку вашего друга в качестве варианта использования в вашем приложении. Поскольку Vision API должен быть более универсальным, в конкретных ситуациях, подобных этой, он не может быть дифференцирован. В этом случае вы можете обучить пользовательскую модель делать то же самое, не зная ML !! Какие??? Обучить модель, не зная ML? Да, вы не ослышались! Это еще один продукт от Google Cloud, предлагающий вам обучить пользовательскую модель, которая соответствует вашим требованиям! Все, что вам нужно сделать, это взять кучу изображений разных классов, которые вы хотите классифицировать, и взлететь! Вы можете загрузить изображения с помощью AutoML Vision Console и просто нажать кнопку Train. Он обучает настраиваемую модель, пробуя все возможные предварительно обученные модели, и дает вам модель, которую вы можете использовать через REST и RPC API. Кроме того, он также предоставляет модель для автономного использования на Android, iOS и пограничных устройствах путем автоматического преобразования модели в требуемый формат (tflite) для использования в автономном режиме для целей с низкой задержкой.

Начните здесь:



TensorFlow и Cloud ML Engine

Вы можете спросить, какова роль инженера по компьютерному зрению, когда Vision API и AutoML уже существуют! Итак, у вас есть модель, которая обучена на AutoML в пользовательских классах (ваша собака и ваш друг), которые вы предоставили, но когда вы хотите преодолеть эту дополнительную милю точности, у вас есть выбор иметь свою собственную пользовательскую модель, обычно CNN в этом случае. У вас есть контроль над предварительной обработкой изображений, обучением различных моделей и получением дополнительной точности. Вот где вам нужно изучить TensorFlow и стать штатным инженером машинного обучения :). Здесь вам нужно управлять всем самостоятельно, включая сбор и форматирование данных, обучение и обслуживание в приложении (подробнее об этом в следующих публикациях!).

Надеюсь, мне удалось сохранить свою работу в конце этого поста и подробно рассказать о различных способах интеграции машинного обучения в ваше приложение!

📝 Прочтите этот рассказ позже в Журнале.

👩‍💻 Просыпайтесь каждое воскресное утро и слышите самые интересные истории недели в области технологий, ожидающие в вашем почтовом ящике. Прочтите информационный бюллетень« Примечательные в технологиях ».