Высококачественный движок преобразования текста в речь для личного использования

Я ищу качественный двигатель TTS, который я могу себе позволить (скажем, менее 1000$). До сих пор я пробовал flite и фестиваль с голосами по умолчанию. Однако, хотя результаты, безусловно, понятны, технические тексты трудно понять.

Коммерческие решения TTS от Loquendo и Readspeaker звучит намного лучше. Однако эти компании, похоже, не хотят продавать свой продукт простым смертным - я не могу найти цену на домашней странице ни одной из них.

Итак, какие есть хорошие решения TTS для личного использования?


person phihag    schedule 10.01.2011    source источник
comment
@Matt H Конечно, практически любая статья Ars Technica, например arstechnica.com/old/content/2008/07/ или arstechnica.com/science/news/2011/01/.   -  person phihag    schedule 20.01.2011


Ответы (14)


Приобретите его на сайте NextUp.com:

NextUp.com продает лучшие, самые естественно звучащие голоса для преобразования текста в речь на более чем 20 языках и со многими доступными акцентами.

Это также:

person linuxbuild    schedule 18.01.2011
comment
Я купил Natural Voices на NextUp.com. Спасибо за обширный список! Я опубликую здесь еще один комментарий, как только мне удастся найти/написать API для него и, возможно, попробовать больше голосов из этого списка. - person phihag; 18.01.2011
comment
FonixTalk и VoiceText, кажется, имеют некоторый API. API Natural Voices стоит 1500 долларов: wizzardsoftware.com/att_desktop_overview.php - person linuxbuild; 18.01.2011
comment
Что ж, вы всегда можете управлять генерацией голоса через SAPI, пока вы работаете в Windows. Кстати, после некоторого тестирования, примеры IVONA на моей машине звучат лучше, чем AT&T. Я их протестирую и выложу сюда ;) - person phihag; 19.01.2011
comment
С 2011 года IVONA, по-видимому, (eon .businesswire.com/news/eon/20110519006454/en/text-to-speech/) превзошел конкурентов, и многие личные отзывы подтверждают это. Я был большим поклонником голосов Acapela в 2011 году, но голоса IVONA, похоже, убирают эффект пузырей. - person mellow-yellow; 30.01.2013
comment
Сотрудник Cereproc здесь. Персональная лицензия для большинства наших голосов стоит 25,99 фунтов стерлингов, а не 400 долларов (это коммерческая лицензия). В качестве альтернативы вы можете использовать наш облачный сервер - person dabhand; 01.03.2016
comment
@dabhand Cerevoice звучит великолепно, особенно облачный сервис (где установка — это чья-то чужая проблема), но меня немного беспокоит отсутствие информации о лицензировании. Могу ли я изменять или распространять сгенерированный контент. Например, в настоящее время я работаю над проектом, в котором (на данный момент) нужно указывать только цифры, для чего достаточно даже бесплатного сервиса. - person phihag; 09.03.2016
comment
@phihag лицензия позволяет изменять и распространять сгенерированное аудио. Я попросил веб-менеджера уточнить условия на сайте. - person dabhand; 19.05.2016

Меня всегда впечатляла Ивона http://www.ivona.com/?set_lang=en У них есть дешевая персональная версия под названием expressivo (добавьте .com — больше ссылок размещать нельзя), которая стоит всего 45 долларов. Я знаю людей, которые смотрят фильмы с Expressivo и читают субтитры, так что на самом деле это очень и очень хорошо.

person gshegosh    schedule 18.01.2011
comment
Действительно, качество отличное, наверное, даже немного лучше, чем у AT&T Natural Voices. Примечательно, что они тоже скрывают эту сумасшедшую цену, но если кто-то заинтересован в коммерческом использовании. - person phihag; 18.01.2011

Вы можете скачать голоса лучшего качества для фестиваля, чем поставляемые вместе с ним:

Похоже, на данный момент они имеют самое высокое качество:
Система синтеза речи (HTS) на основе HMM

Кажется, это тоже нормально:
Проект MBROLA

Источник: HOWTO: заставить фестивальные TTS использовать лучшие голоса (MBROLA / CMU / HTS)

person b4492572    schedule 21.01.2012
comment
Добро пожаловать в Stack Overflow! Хотя на самом деле эта страница может отвечать на вопрос, было бы предпочтительнее включить сюда основные части ответа и предоставить ссылка для ознакомления. Переполнение стека полезно ровно настолько, насколько полезны его вопросы и ответы, и если этот хост выйдет из строя или его URL-адреса будут перемещены, этот ответ станет бесполезным. Спасибо! - person sarnold; 22.01.2012

У AT&T есть продукт под названием Natural Voices. Я думаю, что это звучит потрясающе по сравнению со всеми другими продуктами. Хотя я не уверен в цене.

http://www2.research.att.com/~ttsweb/tts/demo.php

person mj_    schedule 10.01.2011
comment
Качество действительно впечатляет, но при покупке на сайте wizzardsoftware.com/ оно стоит 1795 долл. США всего за одну установку. att_desktop_overview.php - person phihag; 10.01.2011

Есть также несколько довольно впечатляющих решений с открытым исходным кодом.

Это звучит весьма впечатляюще. http://freetts.sourceforge.net/docs/index.php

person hookenz    schedule 18.01.2011
comment
Звучит примерно на уровне фестиваля, может чуть хуже, но лучше, чем флайт. Однако, если вы сравните образцы с коммерческими, на которые есть ссылка в вопросе, вы увидите огромную разницу в качестве. - person phihag; 18.01.2011
comment
Говорящие часы - единственные, которые хорошо звучат. Остальное не очень. Мне нравится движок TTS, встроенный в MacOSX, он довольно хорош. - person hookenz; 19.01.2011

Пожалуйста, проверьте этот сайт.

По сути, это учебник высокого уровня по использованию голосов, доступных на Android, в Linux. Это довольно общее, но техника должна работать для большинства двигателей TTS.

person xryl669    schedule 15.04.2014

Я провел некоторое исследование по этой теме в 2007 году и попробовал несколько систем преобразования текста в речь, чтобы читать статьи или конвертировать их в mp3. Я удивлен, как мало продвинулись с тех пор потребительские продукты TTS.

Сначала я купил TextAloud от NextUp, потому что в веб-сэмплах голоса звучали естественно. Однако оказалось, что из-за ударения в частях предложений было очень трудно понять научные тексты. Я не знаю, улучшилось ли это.

Затем я нашел VoiceReader Home от Linguatec (49 евро за голос), который сделал очень хорошая работа, и с тех пор я не нашел для себя лучшего решения. Linguatec только что выпустил обновление, которым я пользуюсь уже несколько недель, и качество стало еще лучше.

Однако мне не нравится их графический интерфейс и интеграция. Я в основном копирую все тексты, которые хочу прочитать, в окно графического интерфейса. Тем не менее, новая версия также может читать документы pdf и word из файла. И для меня самым главным фактором все же остается легкость прослушивания и понимания текста даже со сложной структурой.

Linguatec выглядит как небольшая немецкая компания. Я не знаю, есть ли у них собственный движок TTS или используется внешний.

Я никак не связан с Linguatec и был бы очень заинтересован в альтернативных предложениях!

person Jacob    schedule 07.02.2015

Удивительно, но Loquendo действительно продает вещи: Прайс-лист для Pay as you go TTS. К сожалению, это работает в режиме онлайн, а генерация голоса по запросу стоит целое состояние (30 минут в день обойдутся чуть менее чем в 120 000 € в год).

person phihag    schedule 18.01.2011

Нюансовый вокализатор, но я боюсь, что они не говорят кое-что о ценах. У Nuance есть много высококачественных приложений для озвучивания, так что, возможно, они смогут вас порадовать.

person InsertNickHere    schedule 18.01.2011

Я использовал естественные голоса AT&T, они кажутся мне наиболее человечными.

person WrightsCS    schedule 19.01.2011

Для личного пользования я использую VocaTalk Personal Podcast. Приложение улучшает речь, делает ее стерео, ставит фоновую музыку, генерирует mp3, загружает на диск SkyDrive/Google, синхронизирует с iTunes или zune и так далее. Идеально подходит для прослушивания в дороге. http://www.vocamedia.com/

person iBe    schedule 04.01.2013

Для личного использования вы также можете использовать «TextAid» от ReadSpeaker. Это персональная программа для чтения через Интернет, использующая голоса Acapela. Он также имеет функцию перевода! http://www.readspeaker.com/readspeaker-textaid/

person Niclas Bergström    schedule 16.07.2014

Как насчет создания речи в Интернете? Вы можете использовать бесплатный веб-сайт audiotext.ws для преобразования текста в речь, чтобы преобразовывать английские тексты в речь.

person Alexander van Trijffel    schedule 12.02.2015
comment
В настоящее время у меня нет звука на этой стороне, он все еще загружается даже через минуту. Это подчеркивает проблему: если что-то пойдет не так в сети или сервисе, приложение перестанет работать. Кроме того, вы можете захотеть воспроизводить звук без связи с сетью — например, как ваше приложение будет уведомлять пользователя о наличии проблемы с сетью? - person phihag; 12.02.2015

Если вы ищете вывод на основе индийского акцента, посмотрите http://www.indiantts.com.

Кажется, это звучит наиболее человечно, на индийских диалектах. Они предлагают скачать mp3, я думаю, из текста.

person Rahul Shah    schedule 26.03.2016