Интернет вещей (IoT) с его повсеместными датчиками и потоками массивных данных для масштабного понимания имеет оценочную рыночную стоимость почти в 2 триллиона долларов. По-видимому, сенсоризация мира — это серьезное дело, позволяющее получить представление о людях, процессах и продуктах в почти непостижимом масштабе. Конечно, 2 триллиона долларов — это почти непостижимая цифра. Ожидается, что соответствующие прогнозы для основанных на данных данных, которые приводят к такой оценке, будут иметь такой же крупный масштаб, чтобы оправдать эти астрономические прогнозы.

Но идеи не жестко запрограммированы в наборах Raspberry Pi или Arduino, хотя наборы IFTTT (If-This-Then-This) могут быть удовлетворительным решением (подробнее об этом позже). Понимание начинается с повсеместного сбора данных (через десятки миллиардов подключенных устройств, которые будут измерять, контролировать и отслеживать почти все). Эти огромные потоки данных представляют собой саму суть больших данных: все измеряется и контролируется. Но это не то же самое, что инсайты. Итак, как нам перейти от сбора петамасштабных данных к масштабным ценностям и знаниям?

Ответ на этот вопрос прост: отправьте свои большие данные собакам!

Почему собаки? Потому что собаки — идеальные сенсоры, сортировщики и часовые.

Например, слух собаки чувствителен к частотам, находящимся за пределами человеческого слуха. Следовательно, они могут обнаруживать сигналы, которые пропускают люди, и даже идентифицировать определенные сигналы среди всего шума, который наполняет воздух.

Во-вторых, у собак есть острое чувство сортировки (устранения неоднозначности и классификации) различных запахов. Их можно научить вынюхивать бомбы, запрещенные наркотики и даже конкретных людей, основываясь только на фрагменте их одежды, несмотря на огромное разнообразие запахов, ароматов и ароматов, пронизывающих мир. Есть истории о собаках, которые узнавали своих предыдущих владельцев после многих лет разлуки, просто обнюхивая их. Собаки даже находили дорогу к своим владельцам через сотни миль разлуки.

В-третьих, из собак получаются отличные часовые (также называемые часовыми). Они способны бить тревогу и предупреждать нас, когда вокруг нас происходит что-то необычное, неожиданное и/или нежелательное. Их можно научить понимать, когда бить тревогу («приближается опасность»), а когда не бить тревогу («приближаются друзья»).

Ну, конечно, я на самом деле не имею в виду, что вы должны отдавать свои данные IoT настоящим собакам. Но я действительно имею в виду, что вы должны отправлять свои потоки данных аналитическим часовым, которые обладают теми же особыми характеристиками собак: острое восприятие различных типов сигналов в «шумной» среде, острые способности к сортировке (устранению неоднозначности и классификации) и разумная обучаемость. изучать разные правила (классификаторы) в ответ на разные входные данные и, таким образом, выдавать действенные предупреждения людям (или другим устройствам). Стражи, о которых я говорю, — это алгоритмы машинного обучения, которые перехватывают и анализируют потоки данных с устройств IoT: «цифровой и аналитический анализ ваших потоков данных IoT».

Что мы ожидаем от наших часовых машинного обучения, особенно в приложениях IoT? Мы ожидаем, что они будут обнаруживать события в потоках данных, узнавать, какие классы событий могут произойти, классифицировать новые события и соответствующим образом предупреждать нас. Этот последний шаг включает в себя сортировку на основе набора бизнес-правил, которые определяют, какие события носят только информационный характер, какие события являются важными (действующими), но не срочными, а какие события требуют срочного реагирования. Именно здесь могут быть очень полезны что-то вроде Архитектуры и рецепты IFTTT — их можно запрограммировать на реакцию на определенные события, сигналы или условия, а затем выполнять определенные действия (обновлять базу данных, отправлять предупреждения, сохранять информацию для последующего распространения, собрать больше данных об этом событии или перейти к следующему).

Четыре фундаментальных метода обучения без учителя

Но есть еще кое-что. Приведенные выше бизнес-сценарии сосредоточены на известных событиях, которые включают применение базовых методов контролируемого машинного обучения (классификации). В ваших потоках данных также может быть ранее невиданное поведение, которое, следовательно, требует неконтролируемых методов машинного обучения. Четыре основных метода обучения без учителя:

  1. Обнаружение классов — найдите классы, сегменты, разделы и кластеры событий и поведений, которые представлены в ваших потоках данных, а затем изучите определяющие границы (в пространстве параметров функций), которые разделяют и различают разные классы (чтобы будущие экземпляры таких событий можно было классифицировать в соответствии с этими правилами).
  2. Обнаружение корреляции (или обнаружение прогностической способности) — найдите тенденции, корреляции и закономерности поведения в ваших потоках данных, которые позволяют развертывать модели прогностической и предписывающей аналитики.
  3. Обнаружение ассоциаций (связей) — находите необычные (неслучайные) сопутствующие ассоциации и связи между различными объектами, событиями и поведением в ваших потоках данных, которые становятся объяснительными и прогнозирующими для будущих событий в вашем домене. .
  4. Обнаружение новизны (сюрприза, аномалии) (иногда называемое обнаружением выбросов, хотя иногда выбросы тоже могут быть неожиданными) — найдите в своих потоках данных редкие (единственные в своем роде) неожиданные «неизвестные неизвестные», которые могут указать на проблемы с датчиком (аппаратным обеспечением), проблемы с качеством данных (программное обеспечение) или совершенно новые открытия (настоящие ценные сюрпризы в вашей области).

_IF_ ваши дозорные обнаруживают интересный сигнал, и если ЭТОТ сигнал представляет собой полезную информацию, ТО вы можете запрограммировать свою аналитическую систему так, чтобы она выполняла соответствующие действия, КОТОРЫЕ лучше всего подходят для вашей организации (на основе бизнес-правил, закодированных в алгоритме) — в этом суть из IFTTT (If-This-Then-That) для обнаружения и быстрого извлечения ценности для бизнеса из потоковой передачи больших данных IoT.

Эти дозорные (алгоритмы машинного обучения и сопутствующие им бизнес-правила) будут наиболее эффективными, если они расположены на границе сети, в точке сбора данных (или рядом с ней) и, следовательно, не относятся к пакетной обработке с высокой задержкой. Низкая задержка — ключевое требование для аналитики IoT. Edge Computing становится горячей парадигмой для удовлетворения этих требований к периферийному интеллекту. Встраивание дозорного (аналитического алгоритма) в датчик или сборщик данных обеспечивает более быстрое осмысление, понимание, реакцию и ценность, что важно, когда данные собираются с огромной скоростью.

Ключевые выводы

Итак, прежде чем мы паникуем из-за надвигающегося взрыва потока данных с миллиардов наших вездесущих устройств в эпоху Интернета всего, давайте поставим на дежурство несколько часовых. Поручите этим «собакам» машинного обучения (алгоритмам аналитики) вести нас от сбора данных через анализ данных к пониманию данных (понимание и ценность). Только тогда мы можем надеяться реализовать обещанную рыночную стоимость Интернета вещей в триллион долларов.

Наконец, обратите внимание на это замечательное предсказание и предупреждение: Компании IoT будут доминировать в 2020-х годах. Ваше резюме готово?

Подпишитесь на меня в Твиттере на @KirkDBorne

Узнайте больше о моем внештатном консалтинговом/обучающем бизнесе: ООО Дата Лидершип Групп

Посмотрите, что мы делаем в ИИ-стартапе DataPrime.ai