Конфиденциальность данных и федеративное машинное обучение

Введение в концепцию федеративного машинного обучения и дополнительного совместного использования секретов.

На рынке искусственного интеллекта доминируют технологические гиганты, такие как Google, Amazon и Microsoft, предлагающие облачные решения и API для искусственного интеллекта. В традиционных методах искусственного интеллекта конфиденциальные данные пользователя отправляются на серверы, где обучаются модели.

Эта централизованная модель связана с проблемой конфиденциальности пользователя. Данные пользователя или клиента доступны централизованной модели вместе с другими необработанными помеченными данными. В результате локальный пользователь не может его контролировать.

Решение? Федеративное машинное обучение

С появлением миллиардов смартфонов с невероятной вычислительной мощностью платформа, на которой могут работать модели машинного обучения, больше не ограничивается процессорами с высокой вычислительной мощностью.

Пришло время разработать архитектуру, в которой централизованная модель использует все локальные модели, чтобы сформировать сверхэффективную модель, которую могут использовать все участвующие устройства.

Это децентрализует этап обучения модели, что дает несколько преимуществ:

Центральная платформа / облако для совместного использования модели, которая содержит исходную модель, которая транслируется на все устройства.
Устройства, подключенные к центральной модели, применяют локальную оптимизацию с использованием локальных данных.
Центральная модель обновляет свою собственную модель, используя модели с других локальных устройств.
Шаг 1 повторяется

Почему это невероятный дизайн?

Этот дизайн поможет вам получить лучшую и обновленную модель из облака, которое дорабатывается другими соавторами, строящими модель.

Вы можете не только использовать свою собственную локальную модель для прогнозирования, но также использовать агрегированные и более точные модели других, чтобы делать более точные прогнозы.

Даже если ваше устройство не вносит достаточного вклада в центральную модель, вы действительно сможете использовать лучшую модель после подключения к облаку.

Звучит здорово, не правда ли?

Какая связь с конфиденциальностью данных?

Хотя приведенный выше дизайн очень эффективен, он не сохраняет конфиденциальность.

Модель, загружаемая из облака другими устройствами для локальной оптимизации, содержит информацию с каждого устройства. Обратный инжиниринг модели может существенно поставить под угрозу конфиденциальность данных:

Локальное устройство может получать информацию о данных от других устройств, когда оно выбирает центральную модель.
Центральная модель имеет доступ к данным с локальных устройств.

Дополнительный секретный секрет для спасения?

Для решения этой проблемы введен метод криптографии под названием Аддитивное совместное использование секрета (ASS).

Обновление модели потребует расчетов нескольких гиперпараметров. Ass предоставляет метод зашифрованных вычислений при агрегировании моделей с разных устройств в центральном агрегаторе моделей (облаке) и передает зашифрованный результат обратно на устройства для дешифровки в частном порядке подключенными устройствами.

Таким образом, устройства не осведомлены о каких-либо идеях / интерпретациях весов других моделей, используемых в расчетах.

Таким образом можно свести к минимуму основные проблемы с конфиденциальностью. Пользовательские данные могут быть защищены из облака, и теперь вычисления будут менее уязвимы для утечки информации о данных.

Какую выгоду может получить организация

Прочитав статью, вы можете задаться вопросом, как организация может извлечь выгоду из обсуждаемых выше концепций. Что делать, если организация хочет использовать вашу модель, но не хочет делиться реальными данными? Кроме того, что, если они хотят запускать вашу модель локально, а не на сервере, на котором она развернута? Вот где такие концепции, как федеративное обучение и зашифрованное машинное обучение, могут быть удобным инструментом: как для настройки модели, так и для совместного использования модели. .

Наконец, у Omdena есть огромные возможности для изучения этой концепции, поскольку такие организации, как Omdena, могут выдвигать требования, в которых им может потребоваться применить машинное обучение к данным, которые им не разрешено видеть. В таких ситуациях зашифрованное машинное обучение и федеративное обучение могут быть удобными инструментами.

Вы можете узнать больше об Additive Secret Sharing из этой статьи.

Google использует федеративное машинное обучение в своей GBoard, а Apple - в Siri.

Вы можете посетить OpenMined, который предоставляет библиотеку Python PySyft для реализации федеративного обучения, отличный инструмент для начала работы с конфиденциальностью данных.

У Udacity есть курс Частный ИИ, который ДОЛЖЕН ИМЕТЬ в вашем ведре, если вы хотите внедрить PySyft в свое приложение.

Федеративное обучение все еще находится на начальной стадии и сталкивается с многочисленными проблемами при его разработке и развертывании, но дает многообещающие первоначальные результаты.

Подробнее о Омдене

Решение проблем путем сотрудничества

Omdena - это инновационная платформа для создания решений искусственного интеллекта для реальных проблем за счет возможностей сотрудничества снизу вверх.