Введение в машинное обучение в IoT

В этом блоге представлен краткий обзор современных возможностей машинного обучения в IoT. В последующих публикациях мы обсудим упомянутые здесь моменты более подробно и опишем варианты использования и стратегии реализации для самых разных задач.

1. Машинное обучение

Машинное обучение находится в области анализа данных. Он основан на идее предоставления компьютеру возможности извлекать информацию из данных и «учиться» на ней. Он поддерживает широкий спектр приложений от распознавания изображений до анализа сигналов, что делает его одной из центральных технологий современных ИТ.

Процесс разработки алгоритма машинного обучения можно разделить на три этапа:

Выбор алгоритма определяет, какой алгоритм лучше всего подходит для текущего варианта использования.
Обучение подает данные для обучения алгоритма. Это позволяет алгоритму установить базовую линию для сравнения будущих данных.
Вывод принимает данные и анализирует их на основе знаний, извлеченных из обучающих данных. Он может возвращать различные результаты в зависимости от алгоритма и варианта использования, но помогает пользователю квалифицировать события.

2. Интернет вещей

IoT Edge обычно относится к устройствам, расположенным рядом с местом, где сигнал становится данными. Это может быть датчик, собирающий и отправляющий данные, или дистанционно управляемый переключатель, который получает сигнал, направляющий его на включение или выключение. Одним из предположений для объектов Edge IoT является небольшая площадь, обычно построенная на микроконтроллерах с низким энергопотреблением.

3. Edge IoT и машинное обучение: архитектура имеет значение.

Первоначально варианты использования IoT полагались почти исключительно на облачные технологии и глубокую науку о данных, поэтому, вероятно, мы не увидели широкого распространения. В последнее время достижения в технологии Edge резко изменили ландшафт, позволив ускорить развертывание решений.

Хотя теоретически все подходы могут быть восприняты, кажется, что каждый подход имеет определенные преимущества и недостатки, которые делают их более подходящими для конкретных случаев использования:

Полное облако. В этом подходе все три этапа машинного обучения — выбор алгоритма, обучение и вывод — выполняются в облаке. Полное облачное решение должно обрабатывать все варианты использования в одной модели, которая имеет доступ к очень большому объему оперативной памяти и вычислительной мощности. Эта единственная модель должна понимать, что является нормальным для каждого отдельного приложения, а затем также понимать, как выглядит аномалия для этого приложения. Такой подход требует обширной кампании по сбору данных, чтобы найти правильный алгоритм и обучить его. Эти части обучающих данных также должны охватывать большой набор репрезентативных вариантов использования, расширяющих требования к сбору данных. Здесь мы описываем многомесячные усилия по завершению сбора данных в лучшем случае. Наконец, эта конструкция требует, чтобы датчики могли отправлять данные в любое время, что имеет ряд последствий, таких как энергопотребление, пропускная способность и безопасность конечных точек.

Облако + Edge: в этом подходе алгоритм выбирается и обучается в облаке, а затем сокращается, чтобы соответствовать пограничному устройству, где он будет делать выводы. Модель, загруженная на каждое пограничное устройство, будет одинаковой. Требования к сбору данных такие же, как и в чисто облачном решении. Основное отличие состоит в том, что решение «облако + периферия» имеет дополнительный шаг после обучения модели, чтобы сжать ее, чтобы она поместилась на микроконтроллере. Уменьшение модели — это область граничного машинного обучения (ML), в которой за последние годы наблюдается некоторый прогресс, что привело к оптимизации таких методов, как сокращение и специальные инструменты; однако этот шаг усложняет модель разработки. В подходе «облако + периферия» модели не требуется постоянное подключение для отправки данных в облако для анализа, поскольку анализ происходит на периферии. Это упрощает разработку поддерживающей инфраструктуры, но также устраняет потенциальную точку отказа в отчетности: сеть передачи.

Full Edge: в этом случае выбор модели выполняется в облаке или на настольном компьютере, а затем передается на микроконтроллеры, на которых она будет реализована, для обучения и вывода.

Эта модель, ориентированная на Edge, требует небольшого сбора исходных данных, что приводит к сокращению временной шкалы перед выбором модели. Обучение выбранной модели будет уникальным для каждого объекта, на котором реализован алгоритм, поэтому модель не должна учитывать «нормальность» какой-либо другой реализации, а только свою собственную. Это приводит к более легким моделям с лучшими характеристиками. Однако эта реализация имеет некоторые недостатки: возможность обучения на микроконтроллере обычно означает, что человек не может находиться рядом с каждым устройством для маркировки данных, поэтому обучение не контролируется. Это приводит к некоторым ограничениям в моделях, которые можно использовать в этом типе реализации. В этом случае наиболее простым классом алгоритмов являются алгоритмы обнаружения аномалий.

4. Вывод:

Какая модель лучше всего соответствует вашим потребностям, будет зависеть от вашего приложения: если вы используете инструмент распознавания изображений с постоянно обновляемой базой данных и алгоритмом, облачная модель может иметь наибольший смысл. С другой стороны, если вы выполняете анализ сигналов для профилактического обслуживания в промышленных условиях, периферийное решение было бы более подходящим и гораздо более доступным.

Однако в машинном обучении в IoT наблюдается тенденция к приближению к периферии. Все меньше и меньше решений представляют собой чисто облачные решения, и все больше решений пытаются приблизиться к датчикам с помощью облачных и граничных решений, гибридов с использованием шлюзов или более полных граничных решений.

Спасибо за то, что прочитали первый выпуск блога Cartesiam’s Edge AI. Не стесняйтесь обращаться к нам по адресу [email protected], если у вас есть какие-либо отзывы или предложения для будущих тем.

Введение в машинное обучение в IoT

Вопросы по теме