Общий обзор моделей машинного обучения с открытым исходным кодом и бизнес-примеров использования искусственного интеллекта.

Расширенное машинное обучение и искусственный интеллект больше не являются далеко идущими технологиями, требующими огромных бюджетов, больших команд под руководством доктора философии. экспертов по математике и месяцев НИОКР. Облачные вычисления и экспоненциальный прогресс в стеках технологий за последние десять лет обеспечивают недорогие реализации, быстрый оборот и легкую проверку бизнес-концепции.

Говоря это, я не недооцениваю настоящих экспертов в области ИИ, которые имеют престижные степени, годы исследований и признание мирового уровня. Именно они добились новаторского прогресса благодаря исследованиям и глубокому пониманию науки. Еще по этой теме.

4-я промышленная революция — машинное обучение и искусственный интеллект

Одна из моих любимых книг высокого уровня по машинному обучению, Наука о данных для руководителей, рассказывает о 4-й промышленной революции, машинном интеллекте. В нем подчеркивается, как стратегии машинного обучения должны существовать в повседневных бизнес-операциях и долгосрочных целях, чтобы добиться успеха на современном рынке. Компании любого размера должны понимать, как и когда они могут использовать ИИ. Использование бизнес-данных необходимо для создания превосходных путей взаимодействия с клиентом, удержания клиентов и оценки текущей бизнес-траектории. Машинное обучение и большие данные можно использовать для повышения операционной эффективности, понимания прошлых и настоящих тенденций, принятия мер для будущего роста и создания собственных решений, соответствующих индивидуальным потребностям бизнеса.

AIaaS — ИИ как услуга

Все основные поставщики облачных услуг имеют API-сервисы, которые могут выполнять почти все общие сценарии использования ИИ. Посмотрите на AWS AI Services, Azure ML и GPC AI Solutions. Они могут стать дорогими в масштабе и не полностью настраиваются, поскольку предназначены для общих целей. Из-за этого, если бизнесу нужно что-то более конкретное, он может расширить свои услуги, используя современные предварительно обученные модели и библиотеки ML с открытым исходным кодом, доступные для всех, кто осмелится их попробовать.

Вот список популярных предварительно обученных моделей машинного обучения и способов их применения в разных отраслях.

БЕСПЛАТНЫЕ/с открытым исходным кодом модели машинного обучения

Многие из перечисленных моделей готовы к использованию с API-подобным доступом. Другие могут использоваться в качестве обучения переносу нейронной сети для обучения чему-то более конкретному. Хорошим примером является обучение общей модели обнаружения объектов обнаружению определенного бренда. Или вы можете использовать их в конвейерном режиме, когда различные модели используются в потоке, например: определение футболки и стиля одежды — › обнаружение бренда на футболке — › наконец, определение когорты по стилю одежды.

Вот модели машинного обучения с открытым исходным кодом, как и было обещано:

  • FaceNet, для распознавания лиц.
  • YOLOV5 для распознавания изображений и объектов и Глубокая сортировка для отслеживания объектов в видео или веб-потоке.
  • Bert или RoBerta для обработки естественного языка. Это модели типа токенизатора. Вот отличный пример того, как предварительно обучить BERT базовую модель с пользовательскими данными. Bert можно использовать в сочетании с набором данных вопрос-ответ как Набор данных SQuAD2.0 для создания очень точной системы автоответчика.
  • SpeechBrain — используется для распознавания голоса
  • MediaPipe — обширные решения машинного обучения, такие как обнаружение объектов, поза, отслеживание объектов, сегментация волос и обнаружение рук.
  • Пророк — PyTorch, прогнозирование временных рядов с учетом сезонности
  • DeepSnap — Графическая нейронная сеть для предсказаний кластеров и подобия.
  • GLIGEN — генерация текста в изображение
  • TorchRec — Системы рекомендаций по внедрению PyTorch

Если вы не видите модель, вы ищете в этом списке. Перейдите в раздел Обнимающее лицо, Модели PyTorch или Модели TensorFlow и найдите дополнительные.

Случаи использования в различных отраслях:

Недвижимость

  • Прогноз спроса и цен в районе. Самый популярный вариант использования — прогнозирование рынка недвижимости на основе временных рядов. Это основано на ранее существовавших рыночных данных с ценами и информацией о доме. Становится интереснее, когда этот источник данных объединяется с экономическими данными и данными местных органов власти — доступными здесь. В этот момент, если вы используете дополнительные данные, такую ​​модель прогнозирования можно переключить с временных рядов на нейронную сеть.
  • Оценка недвижимости с помощью Vision AI. С помощью коммерческих дронов или карт Google можно заблаговременно идентифицировать облагораживания и обновления района с помощью автономных инструментов.

Электронная коммерция и розничная торговля

  • Прогнозирование продажProphet может прогнозировать любые данные временного ряда с нелинейными трендами и характеристиками сезонности. Это идеально подходит для прогнозирования продаж.
  • Прогноз запасов — может использоваться при краткосрочном прогнозировании продаж. Краткосрочные могут игнорировать сезонность и вводить больше маркетинговых планов. Хороший пакет здесь — Прогнозирование PyTorch.
  • Customers LTVLIFETIMES — самый популярный пакет для этой задачи. Он требует больше статистического подхода, чем ML, но показывает отличные результаты.
  • Анализ настроений — ранее упомянутые инструменты Bert или RoBerta могут показать очень положительные результаты для этой задачи в сфере электронной коммерции. Вы можете переобучить одну из этих моделей с вашими данными, если ваша клиентская база использует другой язык или немного другую терминологию.
  • Классификатор оттока и удержания клиентов. Это еще одна классическая проблема для этой отрасли. Это можно решить с помощью классификатора на основе событий. Одной из реализаций может быть Конвейер оттока клиентов на AWS, который обеспечивает сквозной конвейер оттока, использующий конвейер данных и машинного обучения AWS с использованием S3, Athena и SageMaker.
  • Сегментация клиентов — этот метод можно использовать для оптимизации маркетинговой аудитории и рекомендаций по сегментации. Этот процесс можно применить с помощью простого метода машинного обучения кластеризации K-средних. Хитрость здесь заключается в том, чтобы найти правильное количество кластеров и оценить правильность алгоритма. Метод локтя — один из самых распространенных способов выбора размера кластера.

Строительство

  • Анализатор безопасности — Большие стороны конструкции требуют личного наблюдения за безопасностью. Благодаря потоковой передаче видео в режиме реального времени и обнаружению конкретных объектов вы можете определить, носят ли строители каски и соответствуют ли они требованиям строительной площадки. Вы можете использовать AWS Kinesis Video Stream для видеопотока в реальном времени и пользовательскую модель YOLOV5, размещенную на AWS SageMaker, для обнаружения объектов. Или, если вам нужно решение все в одном с небольшой настройкой и работой на периферии, AWS Panorama может подойти.
  • Планировщик проектов — анализируйте затраты, сроки и используемые материалы предыдущих проектов. Это может быть очень творческий проект, поскольку он будет включать в себя различные методы ML из НЛП, регрессии и неконтролируемой кластеризации.
  • Оценщик затрат — в сочетании с планировщиком проектов оценщик затрат может прогнозировать потенциальные затраты и автоматически корректировать смету проекта по мере его выполнения. Он может извлечь уроки из предыдущих проектов и использовать фактические затраты на момент строительства.

Образование

  • Автоматизированные оценщики и репетиторы. Нехватка учителей и индивидуального внимания в классах — бесконечная проблема. Но это тоже можно решить с помощью правильной реализации ИИ. Модели НЛП могут дать учащимся мгновенную обратную связь и сэкономить время учителей, поскольку они не должны сосредотачиваться на грамматической обратной связи, а направляют их более творческому мышлению.

Юридическая информация

  • Классификатор документов. Одной из наиболее трудоемких задач в более обширном судебном деле является обзор документов, их классификация и понимание полезных фактов. ИИ может сэкономить тысячи часов утомительной работы.
  • Юридическое сопровождение — разобраться в юридическом вопросе и ваших возможностях/правах может быть сложно, особенно если вы никогда раньше этого не делали. Тем не менее, есть миллионы решенных публичных кейсов, которые можно использовать в качестве тренировочной базы для ИИ. Это приложение может быть более сложным, поскольку точность (аналогично медицинским приложениям ИИ) является обязательной.

В итоге

Возможности решения задач с помощью искусственного интеллекта практически безграничны. Достигнутая операционная эффективность может быть прямо/или косвенно преобразована в потребительскую ценность. Тем не менее, они по-прежнему являются сложными задачами. Основным узким местом в запуске проекта ИИ является обработка данных, стоящая за решением. Большая часть работы в проекте машинного обучения заключается в сборе и организации правильных данных в правильной форме для понимания моделей машинного обучения. Сбор и структурирование информации часто сложны, даже если определена надлежащая модель/метод для потенциальной реализации. После этого наступает этап моделирования, где необходимо определить подходящую модель машинного обучения или метод искусственного интеллекта с различными методами измерения и итерациями.

Контакты

Я консультант по программному обеспечению, данным и машинному обучению, имею сертификат AWS Machine Learning и AWS Solutions Architect — Professional. Свяжитесь с нами, если вам нужна помощь с вашим следующим проектом по машинному обучению.
Чтобы быть в курсе моих последних статей и проектов, подпишитесь на меня на Medium.