Проблема с моделями изображений public domain/CC и зачем нужен «Opt-Out».

Я видел несколько предложений о том, что инструменты машинного обучения могут «просто использовать общественное достояние/творческое достояние». И хотя это звучит как справедливый компромисс, важно понять, почему этого недостаточно, и почему в конечном итоге сайту с возможностью подписки на изображения потребуется сопутствующая система отказа.

Многие изображения, защищенные авторским правом, размещены на сайтах общественного достояния / CC неправильно.

Итак, у нас возникает проблема: Кто должен найти и удалить эти изображения, защищенные авторскими правами?
У Creative Commons нет ресурсов для ручной курации, и она не сможет проверить, есть ли у них такая возможность. Они обеспечивают основу для творческих сообществ, но не команду правоприменения.
Создатели моделей изображений могут обоснованно заявить о «невиновном нарушении авторских прав», если они основываются на этом содержании, поскольку они могут заявить справедливое предположение о том, что все изображения правильно помечены.(IANAL — здесь я делаю предположение. Если кто-нибудь имеет юридическое образование и хотел бы уточнить, пожалуйста, обращайтесь)

В конечном счете, роль обеспечения соблюдения авторских прав ложится на правообладателя, но ожидать, что каждый художник будет часами регулярно проверять этот сайт на наличие своего контента, — это слишком большой стресс.

По иронии судьбы, я считаю, что модели изображений и их распространение могут стать решением. Мое предлагаемое решение двоякое:

* Такие сайты, как HaveIBeenTrained, позволяют пользователям проверять себя и свои работы с помощью API, который можно использовать для проверки открытых моделей сайтов на наличие ненадлежащего контента. Затем это можно использовать для поиска изображений 1: 1 на этих сайтах, чтобы гарантировать, что их контент не будет добавлен. Думайте об этом как о TinEye или обратном поиске изображений Google, но специально для сайтов, которые разрешают парсинг модели. Это будет правоприменение Opt-Out.

* Использование BLIP на ViT/H при подаче материалов позволит сайтам определять вероятные подписи к изображению и, исходя из этого, оценивать, следует ли рецензировать изображение небольшой группе модераторов/кураторов. Это также можно использовать для предотвращения изображений AI, созданных из предыдущих моделей, которые не имеют значительных изменений по сравнению с исходным материалом.
(BLIP создает предлагаемые подписи к изображению, версию пользовательского интерфейса можно найти здесь — https:// Huggingface.co/spaces/pharma/CLIP-Interrogator )

Ненавижу даже произносить это вслух, но концепции регистрации изображения онлайн (NFT-идеалы) здесь полезны, но я не думаю, что блокчейн — правильное решение.

TL;DR — Даже если Opt-Out используется по умолчанию, кто-то может публиковать изображения без разрешения на таких сайтах, как Flickr, и подписываться на них без разрешения исходного создателя, а также без утвержденного/подтвержденного права собственности на эти изображения на сайте, сайте. владельцы не могут подтвердить это, пока художник не подаст иск о нарушении авторских прав.