Недавно я наткнулся на библиотеку Python под названием textgenrnn, которая, по сути, представляет собой способ обучения рекуррентной нейронной сети генерировать текст на основе обучающего файла, который вы ей даете. Что это значит? Это означает, что вы можете научить свой компьютер писать! Похоже, что большинство людей используют его для очевидного: загрузите файл с вещами, которые говорит Трамп, и наблюдайте, как ваш компьютер выдает кучу восклицательных знаков. Но у меня есть идея получше! Я нашел базу данных, содержащую список побочных эффектов для тысяч лекарств, отпускаемых по рецепту. Я собрал этот список в файл с более чем 7000 уникальных побочных эффектов и подумал, что было бы интересно обучить нейронную сеть придумывать новые побочные эффекты. Один из самых крутых инструментов, который я нашел, — это блокнот для совместной работы, который дает вам бесплатный графический процессор для более быстрого обучения моделей rnn. Существует фантастический учебник здесь, который проведет вас через все. Это действительно легко настроить!

После того, как я настроил модель rnn и загрузил свой файл побочных эффектов, мне просто нужно было установить модель и конфигурацию обучения. 20 эпох было более чем достаточно, чтобы получить хорошие результаты! Происходит то, что вы, по сути, говорите rnn изучить каждый символ в каждом слове и узнать, какие символы предшествуют друг другу и следуют друг за другом. Вместо этого вы можете настроить его на изучение на уровне слов, поэтому вместо того, чтобы узнавать, что за «A» обычно следует «C», за которым следует «U», за которым следует «T», за которым следует «E», он просто узнает, что ACUTE показывает вверх часто.

Давайте пройдемся по некоторым эпохам, чтобы увидеть, как обучался rnn. Здесь следует отметить, что я установил конфигурацию обучения для создания образцов после каждой эпохи, чтобы я мог отслеживать прогресс. Сэмплы генерируются для разных «температур», что по сути похоже на циферблат, который включает творчество. Чем выше температура, тем свободнее rnn писать свои комбинации букв. После Epoch 1 (что означает, что rnn изучил все символы в текстовом файле один раз вперед и назад) вы можете сразу увидеть, что он уже видит такие шаблоны, как «itis» и «sis».

После эпохи 3 вы можете увидеть, как rnn изучает такие слова, как «синдром» и «кровь». Это становится интересно!

После эпохи 5 вы можете видеть такие слова и вещи, как «расстройство», «боль», «изм», и, конечно же, у вас не может быть никаких сумасшедших побочных эффектов без упоминания «анального».

В 10-й эпохе вы видите такие понятия, как «увеличение», «уменьшение», «разряд». Просто подумайте о любой рекламе наркотиков, которую вы видели. Вы слышите такие фразы, как «повышенный риск…» и «позвоните своему врачу, если выписка…». Вы понимаете, к чему все идет?

Мы перенесемся к моменту, когда нейронная сеть была обучена. Вы можете поиграть с повышением или понижением температуры, чтобы сделать результаты более дикими. Я запускал сценарий несколько раз, и Cherry выбрал некоторые из моих любимых вымышленных побочных эффектов. Некоторые из них звучат довольно грубо!

Старческий метаболизм

Сывороточная инфекция

Уровень депрессии повышен

Кровяная бугристость кожи увеличена

Вагинальный дискомфорт

Ректальное расстройство

Давление языка увеличилось

Рак полового члена

Заражение вирусом насекомых

Умственная недостаточность

психотическая головная боль

запор полового члена