Публикации по теме 'speech-synthesis'


Lost for Words: синтез речи с ограниченными данными с использованием линейных сетей
Эта статья является частью серии Academic Alibaba и взята из статьи под названием Адаптация говорящего на основе линейных сетей для синтеза речи , написанной Чжиин Хуан, Хэн Лу, Мин Лей, Чжицзе Янь. , принят IEEE ICASSP 2018. Полный текст статьи можно прочитать здесь Акустические модели, зависящие от говорящего, гарантируют, что системы синтеза речи будут давать точные результаты. При достаточном количестве обучающих данных от целевых говорящих системы синтеза речи могут..

Interspeech 2020 - постоянные достижения в области обработки речи и языка
Это был долгий и сложный год со времени последней межпредметной беседы в Граце. Организаторы на этот раз предприняли отважные попытки поддерживать нормальную личную встречу сообщества обработки речи, зная ценность того, чтобы это собрание людей встречалось и взаимодействовало лицом к лицу. Однако было неизбежно, что переноса конференции всего на несколько недель было недостаточно, чтобы избежать полностью виртуального романа. Несмотря на то, что на пути возникли некоторые проблемы, в..

Ученый искусственного интеллекта: достижение непрерывного синтеза эмоциональной речи
Ученый искусственного интеллекта: достижение непрерывного синтеза эмоциональной речи Это резюме исследования - лишь одно из многих, которые еженедельно распространяются в информационном бюллетене для ученых в области ИИ. Чтобы начать получать еженедельную рассылку , зарегистрируйтесь здесь . Когда дело доходит до разработки надежных моделей взаимодействия человека с машиной, эмоциональная речь является важнейшим компонентом. В результате в недавнем прошлом было много попыток..

Interspeech 2017 — Технология синтеза речи
1. Введение в технологию синтеза речи 1.1 Что такое синтез речи? Технология синтеза речи позволяет преобразовывать текст в речь. Это незаменимый модуль для взаимодействия человека с компьютером. Технология распознавания речи позволяет компьютерам «слушать» человеческую речь и преобразовывать речевые сигналы в слова. Технология преобразования речи позволяет компьютерным программам «проговаривать» слова, которые мы вводим, и преобразовывать их в речь. 1.2 Сценарии применения и..

[2020] Речевое поколение 0: Генеративные модели речевых сигналов на основе вокодера и RNN и CNN
В этой статье я расскажу об основах генерации речи и последних разработках моделей генерации речи на основе RNN и CNN. Если вы заинтересованы, вы также можете получить доступ к версии видео или версии мандарин (中文) . Синтез речи Синтез речи (SS) — это метод создания определенной речи в соответствии с заданными входными данными, такими как тексты (преобразование текста в речь, TTS). Ядром SS является управляемость речевых компонентов, а фундаментальный метод называется вокодер [..

Вопросы по теме 'speech-synthesis'

TTS для потоковой передачи с помощью SpeechAudioFormatInfo с использованием SpeechSynthesizer
Я использую System.Speech.Synthesis.SpeechSynthesizer для преобразования текста в речь. . И из-за анемичной документации Microsoft (см. мою ссылку, там нет замечаний или примеров кода) у меня возникают проблемы с определением разницы между двумя...
5373 просмотров

С чего начать синтез речи
Вы, ребята, возможно, знакомы с механизмом Google TTS: здесь . У меня есть базовое понимание того, как что-то подобное может анализировать ввод и выбирать разные слоги/части речи, но с чего бы мне начать, если бы я захотел создать «голос» для...
709 просмотров
schedule 14.08.2023

синтез речи в perl
Можно ли заставить компьютер (Windows или Linux, Mac) говорить на Perl? Я знаю, что это возможно с помощью сценария VB. Но как насчет перла? В VB мы просто пишем CreateObject("SAPI.SpVoice").Speak"I can speak " Как мы это делаем в perl?
1354 просмотров
schedule 11.04.2023

C# (C++) SAPI - TTS - как получить тайминги речи для читаемого текста
Пожалуйста, кто-нибудь может мне помочь? Я ищу пример, как я могу получить информацию о речевом тексте в TTS через SAPI (я программирую свое приложение на С#, но это не нужно, SAPI такой же на С++ и т. д.). Мне нужна информация, например:...
2489 просмотров

Расширение движка Android TTS
Добавление нового языка в существующий движок TTS в Android. Могу ли я изменить существующий движок, не начиная с нуля? поскольку структура синтеза речи в некоторой степени завершена, возможно, я смогу реализовать TTS для своего языка в соответствии...
1603 просмотров

Библиотека DSP с кодером/декодером LPC
Я пытаюсь создать легкий дифонный синтезатор речи. Все кажется довольно простым, потому что мой родной язык имеет довольно простые правила произношения и обработки текста. Единственная проблема, на которую я наткнулся, это контроль высоты тона....
1773 просмотров
schedule 27.07.2023

Класс не найден, почему?
Я пытаюсь импортировать javax.speech.recognition.Result; в моем коде. Но я получаю ошибку класса не найден. При проверке с помощью javap; следующее:- C:\Documents and Settings\ankit.g>javap javax.speech.recognition.Result Error: class...
778 просмотров

Конфигурация преобразования текста в речь Android и варианты
В настоящее время я разрабатываю приложение, которое интенсивно использует преобразование текста в речь (я использую android.speech.tts.TextToSpeech). Мне удалось интегрировать TTS в свой голос, и в настоящее время американский американский голос по...
894 просмотров

Синтез речи Chrome с более длинными текстами
У меня возникает проблема при попытке использовать API синтеза речи в Chrome 33. Он отлично работает с более коротким текстом, но если я попробую более длинный текст, он просто остановится посередине. После такой остановки синтез речи не работает в...
27358 просмотров

Синтез речи больше не читает китайский текст
Следующий код хорошо работал в течение последних 2 месяцев, пока вчера он не перестал читать китайские тексты, но читает английские тексты, несмотря на то, что язык zh-CN. Судя по всему, теперь он читает только по-английски. Поискав в Интернете и...
625 просмотров

Преобразование текста в речь на лазурном веб-сайте
У меня есть простое веб-приложение, в котором используется System.Speech , чтобы динамически генерировать речь и передавать ее браузеру. К сожалению, этот метод не работает на лазурном веб-сайте. Я изо всех сил пытаюсь найти альтернативный способ...
439 просмотров

Синтез речи WebSpeech: приостановка произнесения1, воспроизведение другого высказывания2 и возобновление высказывания1 — возможно?
Я использую модуль WebSpeech speechSynthesis, чтобы веб-приложение говорило. Однако кажется, что вы можете только добавлять высказывания в очередь, а затем выполнять паузу(), возобновление() и отмену() всей очереди. У меня есть ситуация, когда я...
1132 просмотров

Отменить текущее речевое высказывание, если пользователь переходит на другой путь SVG
У меня есть веб-приложение с svg. Когда пользователь проводит пальцем по экрану, даются разные описания в зависимости от того, в какой части svg он находится. Однако я хочу отменить текущее произнесение речи, если пользователь перейдет на другой...
395 просмотров
schedule 27.04.2023

Как исправить повторение синтезатора речи с #?
Поэтому в основном я использовал два механизма распознавания речи (распознавание речи и распознавание речи1) и один синтезатор речи. Когда распознавателю речи задают вопрос, например, как дела, он отвечает: «Я в порядке» (если компьютер выбирает 2 из...
779 просмотров

Замена года английскими словами в R
Мне нужно предварительно обработать расшифровку речи для принудительного выравнивания. Однако мне трудно заменить год текстовым представлением. Например, 1984 нужно заменить на «девятнадцать восемьдесят четыре». Я попробовал функцию replace_number...
65 просмотров
schedule 22.10.2022

Автономные языки API синтеза речи
Можно ли использовать API синтеза речи в автономном режиме? Если да, могу ли я использовать несколько языков или только язык по умолчанию? Я попробовал этот код, и он работает онлайн, но не работает в автономном режиме. Как я могу заставить его...
634 просмотров

Резервное копирование для HTML SpeechSynthesizer - преобразование текста в речь
В настоящее время я использую SpeechSynthesizer в своем коде Javascript, чтобы компьютер мог озвучивать заданные сообщения вслух. Поддержка SpeechSynthesizer находится здесь: http://caniuse.com/#feat=speech-synthesis Некоторым браузерам не...
84 просмотров

Android-приложение для постоянного распознавания одной фразы или слова
Я разрабатываю приложение для Android со следующими функциями: после того, как приложение будет установлено, оно попросит записать фразу/слово, которое будет действовать как активатор, приложение будет работать в фоновом режиме все время и...
92 просмотров

Женский голос в Google Chrome SpeechSynthesis
Я использую этот точный код в обоих сценариях. var msg = new SpeechSynthesisUtterance(); var voices = window.speechSynthesis.getVoices(); msg.voice = voices[1]; msg.text = "hello world"; msg.lang = 'en-US';...
2624 просмотров
schedule 01.10.2022

Почему я не могу управлять аудиосистемой синтезатора речи Apple macOS с помощью значений ползунка?
Я работаю над включением аудиоустройства для синтеза речи Apple (работает только на macOS, а не на iOS) в AudioKit, и я создал Класс AKSpeechSynthesizer (изначально созданный wangchou в этом запрос на включение ) и демонстрационный проект , оба...
347 просмотров