Машинное обучение, управляемое событиями, позволит новому поколению предприятий принимать невероятно продуманные решения быстрее, чем когда-либо, но готовы ли ваши данные воспользоваться этим преимуществом?

Когда вы смотрите на скорость инноваций в мире ИИ, кажется, что каждый бизнес в конечном итоге попадет в одну из этих двух категорий: те, которые воспользовались преимуществами ИИ, и те, которые вышли из бизнеса, потому что они не могли дольше конкурировать. И ключевым фактором отличия будет количество и качество их данных. Здесь позвольте мне особо выделить слово качество, потому что знание того, что, когда и почему что-то произошло в вашей компании, будет иметь решающее значение.

Но как вы можете быть уверены, что сможете восстановить эту информацию после первого включения системы? Именно в этом заключается основная ценность источника событий: вместо хранения только текущего состояния системы все, что происходит, постоянно сохраняется в виде длинной последовательности неизменяемых событий. Затем состояние, отображаемое пользователям, рассчитывается по запросу, но события никогда не отбрасываются, их всегда можно проверить, повторно обработать или перенаправить в другие места.

Не все разработчики готовы использовать этот способ хранения данных хотя. Источник событий и CQRS, тесно связанные шаблоны, требуют несколько иного образа мышления. Разработчики программного обеспечения, которые не привыкли к ним, как правило, вместо этого возвращаются к реализации решений RESTful, поскольку они воспринимаются проще, но во время разработки это сложно. чтобы предсказать, кому и когда потребуются дополнительные данные», так зачем идти на лишнюю милю? Зачем делать дополнительные инвестиции во время разработки и хранения данных?

В эпоху искусственного интеллекта компания больше не может позволить себе отказаться от всего измерения своих данных, особенно когда это так же важно, как время.

Это именно тот риск, когда вы отбрасываете данные временных рядов, они становятся невосстановимыми. Мы жертвуем частью данных, которые могут стать важными в среднесрочной перспективе, ради предполагаемой краткосрочной выгоды.

Команды специалистов по обработке и анализу данных решают эту проблему с помощью Change Data Capture (CDC). Большинство баз данных ведут журнал операций, который является надежным источником дифференциальных изменений. Но CDC упускает из виду еще одну важную переменную: семантику каждого изменения, то есть причину, по которой произошло изменение. Сказать заказ обновлен не то же самое, что сказать заказ оплачен, второе утверждение гораздо более актуально с точки зрения бизнес-аналитики.

Команда разработчиков, которая осознает важность данных, всегда будет прилагать усилия для создания достаточного количества метаданных, чтобы сделать вывод о контексте. Тем не менее, люди будут совершать ошибки, и чаще всего мы легко решим убрать это из приоритета, когда наступит жесткий крайний срок. Команда, использующая источники событий, создает высококачественные данные без необходимости принятия сознательного решения или дополнительных усилий.

Источники событий снимают с команды разработчиков ответственность решать, нужно ли сохранять изменение, потому что единственный способ изменить состояние системы — это создать событие, которое инкапсулирует, что изменилось, когда и почему.

Но на этом преимущества хранения событий не заканчиваются. События также различаются по своей структуре, их можно легко сортировать и потреблять прогрессивными фрагментами, а поскольку они неизменяемы, нет риска того, что фрагмент данных, который вы уже обработали, выйдет из памяти. sync, потому что другой процесс обновляет его. Все потребители событий могут работать, предполагая, что им нужно обработать только следующее событие в очереди и они не пропустят ни байта данных. Следовательно, они позволяют, среди прочего, то, что некоторые авторы начинают описывать как машинное обучение, управляемое событиями:

  • Сбор данных становится проще благодаря потоку событий в реальном времени, доступному для аналитиков данных, вместо того, чтобы полагаться на статические дампы данных, которые предоставляют моментальный снимок базы данных в определенный момент. Трансляция событий аналогична спортивной трансляции в прямом эфире, которую можно приостановить для просмотра конкретных деталей сцены, воспроизвести повторно для анализа интересных моментов из прошлого или отслеживать в режиме реального времени для просмотра самых последних данных.
  • Становится возможным Непрерывное обучение. Это метод, который эмулирует способность человека адаптировать свое поведение в динамичной среде. Модели переобучаются с учетом последних событий, чтобы постоянно адаптировать их к изменяющимся условиям (т. е. рекомендательная система Netflix требует постоянной тонкой настройки в ответ на появление новых шоу и изменяющиеся предпочтения зрителей).
  • Детализированные манипуляции с данными позволяют принимать решения на основе данных. Аналитики могут просматривать данные под разными углами, повторно обрабатывая события и обнаруживая ранее недоступную информацию. Каждое событие представляет собой изменение, которое можно проанализировать на индивидуальном уровне, например, отдельные транзакции на банковском счете, или обобщить, чтобы увидеть более широкую картину в определенное время, например как остаток на счете. Данные также можно обрабатывать для создания новых перспектив, таких как классификация расходов по типам.

С современными инструментами использование данных таким образом может быть дорогостоящим и по-прежнему требовать опыта специализированных разработчиков или специалистов по данным, но мы ожидаем улучшений в возможностях больших языковых моделей для обеспечения интерфейсов на естественном языке для манипулирования и визуализации данных. . Эти новые модели манипулирования данными сделают эти методы доступными для всех в организации, способствуя развитию настоящей бизнес-культуры, основанной на данных.

Новые усовершенствования в возможностях больших языковых моделей обеспечат интерфейсы на естественном языке для манипулирования и визуализации данных, а также для принятия решений на основе данных на всех уровнях организации.

Короче говоря, со всеми замечательными продуктами ИИ, которые мы видели в последнее время, такими как DALL·E или ChatGPT, мы только царапаем поверхность того, что грядет. Ясно, что искусственный интеллект никуда не денется и будет глубоко влиять на то, как мы ведем бизнес. Чтобы оставаться конкурентоспособными в этом новом мире, управляемом искусственным интеллектом, компаниям необходимо собирать высококачественные данные обо всем, что происходит в их системах.

Источник событий собирает высококачественные данные, упаковывая что, почему и когда для каждого изменения, записывая события, которые можно сравнить с отдельными кадрами камеры безопасности высокой четкости для ваших данных.

Этот постоянный поток событий дает дополнительные преимущества. Данные можно анализировать или манипулировать ими в режиме реального времени, а предыдущие состояния можно воспроизводить повторно. Модели машинного обучения, управляемые событиями, позволяют делать точные прогнозы и автоматически реагировать на сложные сценарии, выступая в роли неутомимого охранника, который постоянно следит за камерами и выявляет неэффективность и риски.

По всем этим причинам мы считаем, что компании, которые внедряют событийно-ориентированные модели и учатся использовать преимущества событийно-ориентированных моделей машинного обучения, будут иметь сильное конкурентное преимущество и лидировать на рынке в новом поколении искусственного интеллекта. >.