Раскрытие данных с помощью коллективного машинного обучения

Платформа блокчейна Fetch.ai позволяет людям работать вместе над обучением моделей машинного обучения, не требуя от них доверия друг другу или центральному органу. Это позволяет разделить преимущества «больших данных» между организациями, которые не могут или не хотят обмениваться данными напрямую друг с другом. Такая ситуация часто возникает во многих отраслях, таких как финансовые услуги, где законы о кибербезопасности, конкуренции или конфиденциальности запрещают обмен данными. Коллективное обучение позволяет группам людей или предприятий работать вместе, чтобы получить выгоду от масштаба и конкурировать с доминирующими игроками в своем секторе.

Централизованный контроль над данными и моделями машинного обучения

Машинное обучение быстро прогрессировало за последнее десятилетие. Быстрые процессоры GPU, огромные наборы данных и глубокие нейронные сети обеспечили беспрецедентную производительность в таких областях, как распознавание речи, машинное зрение и интеллектуальный текст. В то же время программные фреймворки с открытым исходным кодом, такие как Tensorflow и PyTorch, сделали мощные алгоритмы обучения доступными для любого, имеющего доступ к ПК и подключению к Интернету.

Прогресс в области искусственного интеллекта и его более широкое применение могут обеспечить экономический рост, более экологичное будущее и улучшение качества нашей жизни, но его текущее направление вызывает серьезные опасения. К ним относятся возможность дискриминации по признаку расы или пола, а также использование ИИ для вредных действий, таких как политические манипуляции, преступления и войны. В этой статье мы описываем подход к решению другой проблемы; а именно, что успех любого ИИ-бизнеса во все большей степени определяется данными, которые он контролирует.

Централизация данных дает огромную власть посредникам, таким как Google или Facebook, которые контролируют личные данные миллионов потребителей. Это также означает, что во многих отраслях растет гонка за добычей этой новой нефти. Потребители становятся ресурсом или продуктом, что требует значительных затрат на их конфиденциальность и безопасность, и растет озабоченность по поводу возможности манипулирования их поведением.

Для бизнеса «гонка за данными» снижает конкурентоспособность, поскольку действующие лица, накопившие большие объемы данных, с трудом вытесняются новичками. Существующие отрасли, такие как автомобилестроение и производство потребительских товаров, также опасаются, что крупные технологические компании будут собирать свою прибыль, пока они ограничиваются предоставлением коммерческой инфраструктуры. Таким образом, ключевой вопрос заключается в том, как обеспечить преимущества агрегирования больших наборов данных для обучения более совершенным алгоритмам машинного обучения, не прибегая к услугам «больших технологий».

Путь к децентрализованному машинному обучению

Одна часть решения - это метод, известный как федеративное обучение. Вместо того, чтобы централизовать данные в одном месте, федеративное обучение предполагает перенос модели к данным или, точнее, к устройству, на котором они хранятся. Затем модель можно обучить локально с использованием вычислительной мощности устройства и вернуть на центральный сервер. Во время обучения также можно применять методы сохранения конфиденциальности, чтобы гарантировать, что личная информация не просочится из модели. Федеративное обучение повышает безопасность и конфиденциальность, но оставляет все аспекты процесса обучения под контролем центрального посредника, который получает всю финансовую выгоду от владения моделью.

Блокчейны - это другая половина решения, поскольку они позволяют людям совершать транзакции анонимно, не доверяя друг другу или центральному органу. Это позволяет вводить стимулы, которые поощряют хорошие результаты, такие как успешное обучение общей модели. Штрафы также могут применяться к тем, кто постоянно не выполняет свои обязательства или, что еще хуже, рассылает вредоносные обновления в попытке «отравить» модель. Блокчейны также обеспечивают неподкупную запись действий каждого участника. Эта функция позволяет создать репутацию в открытых сетях, а также предоставляет журналы аудита, которые необходимы в строго регулируемых отраслях, таких как здравоохранение и финансовые услуги.

Чтобы сделать этот тип федеративного обучения с участием многих заинтересованных сторон успешным, необходимо преодолеть множество технических препятствий. Мы показали, что первый этап может быть решен с помощью нашего прототипа коллективного обучения, который находится в разработке на Fetch.ai с начала 2020 года. В следующей статье (и сопутствующей статье видео ) мы описываем простейшую версию нашего протокола коллективного обучения и будущие направления повышения его эффективности и производительности.

Раскрытие данных с помощью коллективного машинного обучения

Централизованный контроль над данными и моделями машинного обучения

Путь к децентрализованному машинному обучению

Вопросы по теме