В этом блоге представлен краткий обзор современных возможностей машинного обучения в IoT. В последующих публикациях мы обсудим упомянутые здесь моменты более подробно и опишем варианты использования и стратегии реализации для самых разных задач.

1. Машинное обучение

Машинное обучение находится в области анализа данных. Он основан на идее предоставления компьютеру возможности извлекать информацию из данных и «учиться» на ней. Он поддерживает широкий спектр приложений от распознавания изображений до анализа сигналов, что делает его одной из центральных технологий современных ИТ.

Процесс разработки алгоритма машинного обучения можно разделить на три этапа:

  • Выбор алгоритма определяет, какой алгоритм лучше всего подходит для текущего варианта использования.
  • Обучение подает данные для обучения алгоритма. Это позволяет алгоритму установить базовую линию для сравнения будущих данных.
  • Вывод принимает данные и анализирует их на основе знаний, извлеченных из обучающих данных. Он может возвращать различные результаты в зависимости от алгоритма и варианта использования, но помогает пользователю квалифицировать события.

2. Интернет вещей

IoT Edge обычно относится к устройствам, расположенным рядом с местом, где сигнал становится данными. Это может быть датчик, собирающий и отправляющий данные, или дистанционно управляемый переключатель, который получает сигнал, направляющий его на включение или выключение. Одним из предположений для объектов Edge IoT является небольшая площадь, обычно построенная на микроконтроллерах с низким энергопотреблением.

3. Edge IoT и машинное обучение: архитектура имеет значение.

Первоначально варианты использования IoT полагались почти исключительно на облачные технологии и глубокую науку о данных, поэтому, вероятно, мы не увидели широкого распространения. В последнее время достижения в технологии Edge резко изменили ландшафт, позволив ускорить развертывание решений.

Хотя теоретически все подходы могут быть восприняты, кажется, что каждый подход имеет определенные преимущества и недостатки, которые делают их более подходящими для конкретных случаев использования:

Полное облако. В этом подходе все три этапа машинного обучения — выбор алгоритма, обучение и вывод — выполняются в облаке. Полное облачное решение должно обрабатывать все варианты использования в одной модели, которая имеет доступ к очень большому объему оперативной памяти и вычислительной мощности. Эта единственная модель должна понимать, что является нормальным для каждого отдельного приложения, а затем также понимать, как выглядит аномалия для этого приложения. Такой подход требует обширной кампании по сбору данных, чтобы найти правильный алгоритм и обучить его. Эти части обучающих данных также должны охватывать большой набор репрезентативных вариантов использования, расширяющих требования к сбору данных. Здесь мы описываем многомесячные усилия по завершению сбора данных в лучшем случае. Наконец, эта конструкция требует, чтобы датчики могли отправлять данные в любое время, что имеет ряд последствий, таких как энергопотребление, пропускная способность и безопасность конечных точек.

Облако + Edge: в этом подходе алгоритм выбирается и обучается в облаке, а затем сокращается, чтобы соответствовать пограничному устройству, где он будет делать выводы. Модель, загруженная на каждое пограничное устройство, будет одинаковой. Требования к сбору данных такие же, как и в чисто облачном решении. Основное отличие состоит в том, что решение «облако + периферия» имеет дополнительный шаг после обучения модели, чтобы сжать ее, чтобы она поместилась на микроконтроллере. Уменьшение модели — это область граничного машинного обучения (ML), в которой за последние годы наблюдается некоторый прогресс, что привело к оптимизации таких методов, как сокращение и специальные инструменты; однако этот шаг усложняет модель разработки. В подходе «облако + периферия» модели не требуется постоянное подключение для отправки данных в облако для анализа, поскольку анализ происходит на периферии. Это упрощает разработку поддерживающей инфраструктуры, но также устраняет потенциальную точку отказа в отчетности: сеть передачи.

Full Edge: в этом случае выбор модели выполняется в облаке или на настольном компьютере, а затем передается на микроконтроллеры, на которых она будет реализована, для обучения и вывода.

Эта модель, ориентированная на Edge, требует небольшого сбора исходных данных, что приводит к сокращению временной шкалы перед выбором модели. Обучение выбранной модели будет уникальным для каждого объекта, на котором реализован алгоритм, поэтому модель не должна учитывать «нормальность» какой-либо другой реализации, а только свою собственную. Это приводит к более легким моделям с лучшими характеристиками. Однако эта реализация имеет некоторые недостатки: возможность обучения на микроконтроллере обычно означает, что человек не может находиться рядом с каждым устройством для маркировки данных, поэтому обучение не контролируется. Это приводит к некоторым ограничениям в моделях, которые можно использовать в этом типе реализации. В этом случае наиболее простым классом алгоритмов являются алгоритмы обнаружения аномалий.

4. Вывод:

Какая модель лучше всего соответствует вашим потребностям, будет зависеть от вашего приложения: если вы используете инструмент распознавания изображений с постоянно обновляемой базой данных и алгоритмом, облачная модель может иметь наибольший смысл. С другой стороны, если вы выполняете анализ сигналов для профилактического обслуживания в промышленных условиях, периферийное решение было бы более подходящим и гораздо более доступным.

Однако в машинном обучении в IoT наблюдается тенденция к приближению к периферии. Все меньше и меньше решений представляют собой чисто облачные решения, и все больше решений пытаются приблизиться к датчикам с помощью облачных и граничных решений, гибридов с использованием шлюзов или более полных граничных решений.

Спасибо за то, что прочитали первый выпуск блога Cartesiam’s Edge AI. Не стесняйтесь обращаться к нам по адресу [email protected], если у вас есть какие-либо отзывы или предложения для будущих тем.