Глубокое обучение (ГО) сегодня является горячей темой. С годами глубокое обучение развивалось и открывало новые области для искусственного интеллекта. Однако это не означает, что алгоритмы глубокого обучения никогда не подводили. Как и любая другая технология, глубокое обучение имеет свои возможности и ограничения. Хотя глубокое обучение все еще развивается и является интересной областью исследований в области современных технологий.

Глубокое обучение — это данные, которые вы предоставляете

В 2016 году Microsoft запустила своего чат-бота Tay с поддержкой искусственного интеллекта, который должен был взаимодействовать с пользователями Twitter, имитируя поведение любопытной девочки-подростка. Не прошло и 24 часов, как этот диалоговый интерфейс с искусственным интеллектом превратился в расиста, женоненавистника и отрицателя Холокоста. И все это произошло из-за того, что пользователи твиттера троллили Тэя, намеренно распространяя дезинформацию.

Глубокое обучение, подмножество искусственного интеллекта, полностью зависит от данных, которые передаются его алгоритму. И что еще более важно, чем больше размеченных данных поступает в алгоритм глубокого обучения, тем лучше будут работать модели глубокого обучения. По сути, алгоритм глубокого обучения становится неосведомленным или предвзятым в зависимости от данных, которые ему передаются на этапе обучения.

Следовательно, предприятия должны понимать, что перед развертыванием своего приложения для глубокого обучения они должны обучить свою модель с помощью огромного количества соответствующих данных.

Остерегайтесь несбалансированных данных

В недавнем исследовании, проведенном Массачусетским технологическим институтом и Стэнфордским университетом, группа исследователей наблюдала за тремя системами распознавания лиц с поддержкой ИИ и обнаружила, что точность результатов, представленных в отношении пола и расы, была не на должном уровне.

На самом деле, это программное обеспечение для распознавания лиц точно определяло пол белых мужчин, а частота ошибок увеличивалась при определении пола темнокожих мужчин. Программа идентифицировала известных женщин, таких как Опра и Мишель Обама, как мужчин.

Такая предвзятость в классификации исходит из наборов данных, используемых при обучении нейронных сетей глубокого обучения. Это может быть активная предвзятость или бессознательная предвзятость тренера по исследованию данных, что снижает точность определения пола.

Решение таких проблем состоит в том, чтобы вовлечь в проект разнообразную рабочую силу, а программисты должны избегать алгоритмической предвзятости и использовать сбалансированные данные. Сбалансированные данные, которые они передают или используют для обучения DNN, должны содержать подробные сведения о различных аудиториях, демографии, поле и многом другом.

Добавьте ансамбли в свои модели глубокого обучения

В 2015 году Facebook запустил M — чат-бота-помощника, который может выполнять ряд задач, таких как заказ еды, покупка подарков, совершение покупок, вызов такси, беседа и многое другое. Этот чат-бот изначально был запущен для ограниченного числа пользователей в районе залива, чтобы проверить его производительность и обучить ИИ быть независимым. Facebook создал личного помощника по имени M, используя Wit.ai, и запустил его бета-версию в качестве эксперимента. Это был помощник, управляемый человеком, и Facebook ожидал, что по мере увеличения числа взаимодействий с людьми его модель ИИ будет обучена меньше полагаться на людей, но это не удалось. И, в конце концов, через пару лет закрыли.

Другая компания X.ai использует ИИ, чтобы помочь своим пользователям управлять своими почтовыми ящиками, читая электронные письма, планируя звонки, задачи, встречи и многое другое. Они используют NLP в определенной степени, но у них есть большая команда роботов-людей, которые удаленно отслеживают и исправляют работу ИИ.

Эти примеры из реальной жизни показывают, насколько важно для этих компаний улучшать свои модели глубокого обучения с помощью ансамблей. По сути, ансамбли обучают несколько моделей, а затем объединяют их вместе для повышения производительности. В вышеупомянутых сценариях важно обучить несколько моделей глубокого обучения для выполнения аналогичных задач с использованием аналогичных наборов данных.

Работа с фейковыми новостями и глубокими фейками

Технология Deepfakes создает необнаруживаемые поддельные видео с использованием искусственного интеллекта и заменой чьего-то лица и голоса известной знаменитостью, политиком или самозванцем. Для создателей дипфейков платформы социальных сетей, такие как YouTube, Facebook, Twitter и Reddit, являются основными целевыми средами.

Один из самых громких случаев, когда дипфейки попали в центр внимания, был, когда BuzzFeed создал видео, в котором Обама дразнил Трампа. Эта технология использовалась для наложения лица Обамы на видеозапись Джордана Пила — голливудского режиссера. Таким образом, это доказывает, что люди со злым умыслом могут использовать дипфейки, чтобы запятнать репутацию известных политиков и знаменитостей.

В настоящее время не существует решения, позволяющего предотвратить редактирование изображений, видео и аудиоконтента дипфейками, что может ввести в заблуждение, однако исследователи работают над поиском решения.

Помимо этого, в настоящее время создается множество искаженных историй или фальшивых новостей, чтобы ввести людей в заблуждение. Но такие фальшивые новости можно автоматически обнаруживать, обучая модели глубокого обучения понимать нюансы естественного языка. После того, как ваша модель глубокого обучения обучена с использованием огромного количества соответствующих данных, она может предсказывать поддельный новостной контент между заданной парой заголовка и тела статьи, используя двоичную классификацию и архитектуру нейронной сети.

Итак, с одной стороны, у нас есть технология дипфейков, которая использует глубокое обучение для подделки, а с другой стороны, глубокое обучение развилось настолько, что может предсказывать фальшивые новости.

Последнее слово
Мы обсудили потенциал и проблемы глубокого обучения, которое все еще развивается, и многие исследователи работают над его развитием. Таким образом, чтобы предприятия могли использовать существующий потенциал глубокого обучения, они должны понимать проблемы, связанные с проектированием и применением глубокой нейронной сети (ГНС) для решения конкретной задачи.

Кроме того, для развертывания хорошо работающего реального приложения вам необходимо правильно спроектировать и выполнить все этапы от подготовки данных, проектирования сети, обучения до логического вывода. Если вы хотите внедрить решение для глубокого обучения для своей бизнес-модели, поговорите с нашими экспертами.

Первоначально опубликовано на https://www.softwebsolutions.com 2 января 2019 г.