Эта работа опубликована в материалах 6-й итальянской конференции по компьютерной лингвистике.

Аннотация: Если бы нужно было составить дорожную карту для вычислительной критики и последующей искусственной литературы, она, безусловно, учитывала бы шекспировские пьесы. Демонстрацию этих структур посредством анализа текста можно рассматривать как наивную попытку, так и как научный взгляд на характеристики текстов. В данном исследовании для этой цели был проведен текстологический анализ пьес Шекспира.

Методологически мы последовательно используем скрытое распределение Дирихле (LDA) и разложение по единичным значениям (SVD), чтобы извлечь темы, а затем уменьшить распределение тем по документам в двумерном пространстве. Первый вопрос спрашивает, существует ли жанр под названием «Романтика» между пьесами «Комедия» и «Трагедия». Второй вопрос заключается в том, если взять речь каждого персонажа за текст, можно ли выявить драматические отношения между ними.

Следовательно, мы находим отношения между жанрами, также подтвержденные литературной теорией, и главные герои следуют антагонизмам внутри пьесы по мере увеличения длины речи. Хотя результаты классификации второстепенных персонажей в пьесах не всегда такие, какие можно было бы ожидать, исходя из прочтения пьес, имеются наблюдения над драматическим вымыслом, что подтверждается и теорией литературы. Трагедии и драмы мести имеют разные группы персонажей.

Статья: http://ceur-ws.org/Vol-2481/paper75.pdf