Меня всегда очаровывали любовные романы - те, которые продают в аптеке за пару долларов, обычно с красивыми, приглушенными парами на обложках. Поэтому, когда несколько недель назад я начал экспериментировать с нейронными сетями, генерирующими текст, у меня возникло острое любопытство, чтобы узнать, какой вклад искусственный интеллект может внести в неизменно популярный жанр. Может быть, однажды на компьютерах будут написаны целые книги. А пока начнем с заголовков.

Я собрал более 20000 названий романов Арлекина и передал их нейронной сети, типу искусственного интеллекта, который изучает структуру текста. Он достаточно силен, чтобы соединять слова воедино почти по-человечески. 90% человек. Остальные 10% - это чушь.

Я не был разочарован тем, что получилось. Я даже отфотошопил некоторые из своих фаворитов (имена авторов также были синтезированы из машинного обучения). Давайте посмотрим по темам:

Младенцы, младенцы и другие дети

Обычная тема в любовных романах - беременность, и слово «ребенок» широко использовалось в названиях, на которых я тренировала нейронную сеть. Естественно, нейросеть придумала множество названий на детскую тематику:

  • Средиземноморский ребенок
  • Беременность младенца
  • Младенец-варвар
  • Шантажируемый ребенок
  • Греческий бэби-босс
  • Стать младенцем графом
  • Соблазнение маленького доктора
  • Младенец госпожи мужчины
  • Секретный секретный ребенок
  • Детский хирург хирурга
  • Беременная от ярости
  • Двойной ребенок
  • Непреодолимый хороший ребенок

Магнаты, члены королевской семьи, плейбои и боссы

В мире Арлекинов необычно высокая концентрация шейхов, викингов и миллиардеров. Точно так же нейронная сеть произвела несколько ярких новых типов холостяков:

  • Его беременный принц
  • Брачный шериф шейха
  • Purter the Playboy
  • Девственница принца Девы Марии
  • Шторм Джейк
  • Консультант граф
  • Дева Викинг
  • Круглые братья принца
  • Принц папа шейх?
  • Бабочка Эрл
  • Тайный луч греха
  • Посчитайте предложение Сергея
  • Английский миллионер-следователь
  • Удобные желания шейха

У меня так много вопросов. Как беременна принцесса? Какие консультации дает граф? Кто такой Баттерфляй Эрл? И что делает желания шейха такими удобными?

Жениться

Хотя бывают исключения, большинство любовных романов заканчиваются «навсегда и навсегда». Многие из них даже начинаются с неожиданной свадьбы - брака по расчету, заключения делового контракта или притворства, превращающегося в настоящую любовь. Нейронная сеть, кажется, усвоила кое-что о супружестве:

  • Хозяйка жена
  • Муж Невеста
  • Долина Брака
  • Ее брак брак
  • Муж Муж
  • Пропавшая невеста
  • Брачное прикосновение мужчины
  • Долина брака миллиардера
  • Дикая невеста
  • Консультант Невеста

Они зовут меня доктор любовь

Врачи и хирурги - частые любовницы любовниц, направляющихся в долину брака:

  • Хирургия у моря
  • Странный хирург-консультант
  • Предложение врача для детей
  • Мужчина для доктора мужа
  • Уважаемый доктор Хай-Кунгли, соблазнительная ошибка
  • Мой горячий доктор
  • Хирургическое соблазнение

Под омелой

Рождество - волшебное время для хирургов, шейхов, плейбоев, пап, консультантов и женщин, которые их любят:

  • Победа на Рождество
  • Рождество года
  • Рождественский рай для беременных
  • Рождество с ее шантажом
  • Пустынный Санта
  • Санта-жена
  • Невозможная Санта-Жена
  • Тайный заговор босса на рождественское желание
  • Миссия: Рождество в Книт

Что или где находится Книт? Мне просто нравится "Миссия: Рождество" ...

Дом на полигоне

Эта нейронная сеть никогда не видела большого неба Монтаны, но у нее есть несколько сомнительных представлений о ковбоях:

  • Запретный Техас, Техас
  • Акушерка Cowpoke
  • Беременная корова
  • Любитель крупного рогатого скота
  • Под ковбоем
  • В горах для нежного соблазнения

Грязные

Нейронная сеть сгенерировала несколько названий с рейтингом PG-13:

  • Сексуальный роман
  • Опасно! Соблазнение
  • Частная часть
  • Наследование пола
  • Любители секса
  • Голый горячий рейнджер
  • Девственное свидание сексуального
  • Секс месть

Довольно удручающие книги

Они не могут жить долго и счастливо. Некоторые из созданных названий звучали так, будто М. Найт Шьямалан был соавтором:

  • Кровь!
  • Рыдания над боссом
  • Замужем в страхе
  • Рождество от страха
  • Горячий Fearhaper

Как здесь появилось слово «страх»? Возможно, сеть сгенерировала его, не имея «страха» в обучающем наборе, но часть империи Арлекинов ориентирована на паранормальные и готические романы, которые могли включать это слово (* Примечание: я проверил, и там было «Покров страха» »Опубликовано в 2012 г.).

Что ж, вы пробовали, компьютер

Подводя итог, некоторые из восхитительных сбоев и промахов, сгенерированных нейронной сетью:

  • Папа стоит риска
  • Слава в темноте
  • Джаггеры
  • Не могу хорошо
  • Спящий ребенок-мужчина
  • Никогда не было
  • Я ненавижу морской пехотинец
  • Романтическое сердце
  • Некритичный
  • Под прикрытием Movercum
  • Пленник что-то холостяк
  • Идеальная великанша
  • Падая за ее порог
  • Buttymance Ноокана
  • Crassion
  • Больница для беременных Кром

Надеюсь, вам понравились компьютерные любовные романы вдвое меньше, чем мне. Может быть, кто-нибудь там напишет о Деве Викинге, Графе-консультанте или Соблазнении детского хирурга. Я бы это купил.

Методы

Я создал веб-скребок на Python (спасибо, Beautiful Soup!), Который собрал около 20 000 названий любовных романов, опубликованных под брендом Harlequin с сайта FictionDB.com. Для меня Арлекин является синонимом романтического жанра, хотя он составляет лишь часть (хотя и здоровую) от всего рынка. Я загрузил этот список названий книг в повторяющуюся нейронную сеть, используя программное обеспечение, которое я получил от GitHub, и ждал несколько часов, пока не произойдет волшебство. Модель, которую я подобрал, представляла собой трехуровневую рекуррентную нейронную сеть с 256 узлами. Я также обучил сеть из списка авторов созданию новых псевдонимов. Чтобы узнать больше о нейронной сети, которую я использовал, ознакомьтесь с великолепной работой Андрея Карпаты.

Опечатка

Я обнаружил, что «Хирургия у моря» на самом деле настоящий роман, написанный Шейлой Дуглас и опубликованный в 1979 году! Итак, это не оригинальное создание нейронной сети. Поскольку обучающая выборка довольно мала (всего около 1 МБ текстовых данных), следует ожидать, что иногда машина будет выдавать одно из названий, на которых она была обучена. Когда это произошло, одним из наиболее сложных аспектов этого проекта было различение, поскольку настоящие опубликованные заголовки могут быть более удивительными, чем все, что создано искусственным интеллектом. Например: «Папа за 4,98 доллара» и «Гринч 6 футов 1 дюйм» - оба настоящие. Фактически, самый первый любовный роман, опубликованный Арлекином, назывался «Ламантин».