COVID-19 привел к беспрецедентному глобальному кризису. Помимо теста на нуклеиновые кислоты, медицинский диагностический анализ изображений с использованием машинного обучения становится все более важным для раннего выявления и дальнейшего лечения.

Этот сценарий представляет собой проблему для стандартных подходов к машинному обучению.
Совместное использование диагностических изображений может быть проблемой в соответствии с такими правилами, как GDPR, в то время как модель обучения не может быть выполнена только при недостаточном наборе данных.

На практике инженеры внедряют федеративное обучение для решения этой проблемы. Федеративное обучение позволяет устройствам на периферии совместно изучать общую модель (даже глобально), сохраняя при этом все обучающие данные на устройстве, отделяя возможность машинного обучения от необходимости хранить данные в облаке.

Новая задача стека данных

Этот подход, однако, вызывает другую серьезную проблему: высокую стоимость связи.

Согласно Google: каждый раз, когда любое устройство загружает текущую модель, улучшает ее, изучая данные на краю, а затем суммирует изменения в виде небольшого целенаправленного обновления. Только это обновление модели отправляется в облако с использованием зашифрованной связи, где оно немедленно усредняется с другими обновлениями для улучшения общей модели. Все тренировочные данные остаются на устройствах, а в облаке не хранятся отдельные обновления.

Короче говоря, такие итерационные алгоритмы требуют подключения к обучающим данным с малой задержкой и высокой пропускной способностью.

Кроме того, вашего внимания требует одно особое условие: загрузка весит столько же, сколько и загрузка. Правда в том, что большинство устройств работают с ненадежными и относительно медленными сетевыми подключениями. Кроме того, скорость загрузки обычно в 2–4 раза ниже, чем скорость загрузки.

Итак, помимо улучшения алгоритмов, как мы можем это улучшить?

Время, Время, Время

Время действительно имеет значение в таком сценарии. Поскольку все мы знаем, что данные на устройствах должны передаваться в режиме реального времени с малой задержкой, иначе не может быть гарантирована точная диагностика.

Возможно, QUIC сможет улучшить это. QUIC расшифровывается как Quick UDP Internet Connection, впервые развернутый Google в 2013 году.

Одним из основных различий между QUIC и TCP является производительность при относительно плохом сетевом соединении. QUIC работает как машина, а TCP
как повозка (подробности в здесь).

В этой статье ученый изучил подходы к анализу медицинских диагностических изображений с федеративным обучением. Мы видим, что медицинские изображения имеют размер от 10 МБ до 1000 МБ, что занимает не менее 65 секунд для загрузки обновлений.

Согласно сравнительному отчету QUIC, при условии высокой задержки, потери пакетов и высокой пропускной способности QUIC будет работать намного лучше, чем TCP, включая время на передачу и пропускную способность.

Таким образом, мы можем видеть один и тот же вариант использования, ниже приведены наборы инструментов, которые могут быть полезны.

  1. QUIC

Предполагается, что QUIC заменит TCP в качестве транспортного протокола для HTTP/3. Вы можете обратить пристальное внимание на Блог Google, а также узнать больше новостей здесь.

2. Платформа потоковой передачи

Потоковое распознавание изображений, развернутое с помощью фреймворка поверх QUIC, может сократить общее время загрузки и вывода ИИ.

3.Создание распределенного приложения за секунды

Macrometa и Cloudflare позволяют интуитивно и быстро создавать приложения, которые обычно требуют значительных инвестиций с высоким техническим риском и сложностью.

Новый стек технологий

В этом случае обнаружение COVID-19 уже бросило вызов традиционному стеку технологий. Переносить огромные объемы данных, сгенерированных на устройствах, в облако — не лучший выбор, особенно когда их необходимо обрабатывать в режиме реального времени.

В следующем десятилетии наступит новая эра децентрализованных данных, генерируемых с различных устройств. Мы видим, что геораспределенные вычисления могут быть аналогом облачных вычислений. Надеюсь, вы присоединитесь здесь, чтобы обсудить.