Публикации по теме 'tacotron2'


Внедрение Capacitron  — выразительной модели преобразования текста в речь VAE — проект магистерской диссертации
Этот пост представляет собой краткое и избранное техническое резюме моей реализации выразительной модели преобразования текста в речь от Google в рамках моей магистерской диссертации в Берлинском техническом университете. Поскольку представленная мной дипломная работа доступна онлайн , этот пост представляет собой гибридную часть работы, демонстрирующую некоторые аудиосэмплы из модели, а также некоторые интересные детали технической реализации, которые могут быть интересны читателю...

Такотрон-2: реализация и эксперименты
Почему мы хотим преобразовать текст в речь? Не одна, а множество причин, по которым можно использовать TTS, например, специальные возможности для людей с плохим зрением, средства коммуникации для немых людей, голосовые помощники, такие как siri, программы чтения с экрана, автоматизированные системы телефонии, аудиокниги, более легкое изучение языка и т. Д. В декабре 2016 года Google опубликовал новое исследование под названием Tacotron-2 , нейросетевое решение для синтеза речи...