Вопросы по теме 'google-speech-api'

Можно ли настроить распознавание речи Google для Android?
У меня есть несколько вопросов, связанных с распознаванием речи Google в Android. Я разработал приложение для Android, используя онлайн-сервис Google Speech Recognition. Теперь, чтобы улучшить его, мне нужно знать ответы на следующие вопросы....
1967 просмотров

Как разобрать ответ Google Speech API в текстовом поле
Я работаю над API речи Google в С#. Google возвращает результаты без проблем, и его ответ отображается в моем текстовом поле. Теперь я хочу, чтобы ограниченный текст отображался в текстовом поле. Как указано ниже, я хочу, чтобы отображался...
463 просмотров

Разбор нескольких объектов с помощью Jobject в Newtonsoft.Json.Linq
Я пытаюсь разобрать результат из речи Google в текстовый API. Ответ json: {"result":[]} {"result":[ {"alternative":[ {"transcript":"hello Google how are you feeling","confidence":0.96274596},...
2788 просмотров
schedule 19.10.2022

API Google Cloud Speech: Nodejs
Я видел демонстрацию на сайте разработчиков google, а также на сайте git hub https://github.com/GoogleCloudPlatform/nodejs-docs-samples/tree/master/speech . У меня вопрос, как передать параметр языка? Я использую это так: var speech =...
494 просмотров

доступ к аудиофайлам из Google Cloud Storage при использовании Google Speech
Я использовал этот фрагмент кода ниже, чтобы успешно проанализировать файл .wav, который содержит речь, в текст, используя Google Speech. Но я хочу получить доступ к другому файлу .wav, который я разместил в облачном хранилище Google (публично), а...
2294 просмотров

Google Speech API возвращает 403 PERMISSION_DENIED
Я использую Google Speech API для преобразования звука в текст из моего PHP-приложения (с использованием PHP-клиента Google Cloud) в течение нескольких месяцев без каких-либо проблем. Но теперь мои звонки начали возвращать 403 ошибки со статусом...
4967 просмотров

Протестируйте Google Speech API с аудиофайлом
Я хочу посмотреть, будет ли Google Speech API достаточно точным для моих целей. У меня есть аудиофайл, с которым я хочу его протестировать, но демонстрация на главной странице позволяет записывать только с микрофона. Есть ли способ протестировать...
1008 просмотров

Ошибка в полезной нагрузке JSON при попытке доступа к API Google Cloud Speech
{ "config": { "encoding":"FLAC", "sample_rate": 16000, "language_code": "en-US" }, "audio": { "uri":"gs://speechtotextapi/audio_file.flac" } } curl -s -X POST -H "Content-Type: application / json"...
667 просмотров

Не удалось проанализировать ошибку Podfile.lock при установке/обновлении Pod.
Не удалось обновить/установить модули. Ошибка: «Невозможно проанализировать файл Podfile.lock». Последний установленный модуль: модуль «googleapis», :path => '.' После этого возникла проблема. начал приходить. Журнал ошибок [!] ERROR:...
733 просмотров

Как я могу передать аудиовход в формате WebM в Google Speech API
Разработка веб-приложения для реагирования, для которого требуется программа распознавания речи, для которой мы используем диктофон, он создает вывод в формате WebM, как использовать это для API речи Google. Спасибо
833 просмотров

Как получить прошлую информацию при преобразовании речи в текст в Android?
Поскольку я разрабатываю приложение для Android и хочу преобразовать речь в текст, я использую встроенную функцию ввода речи Google для преобразования голоса в текст. Мне нужна предыдущая информация, но она постоянно очищается, я получаю только...
573 просмотров

Ошибка режима улучшения Google Cloud Speech API
Я пытаюсь использовать поле setUseEnhanced в Speech API и получаю такую ​​ошибку: java.util.concurrent.ExecutionException: com.google.api.gax.rpc.InvalidArgumentException: io.grpc.StatusRuntimeException: INVALID_ARGUMENT: недопустимое...
881 просмотров

google-speech-api и переопределение распознавания номера телефона
Кто-нибудь знает, есть ли способ манипулировать распознаванием телефонных номеров при использовании Google Speech API? Я пытаюсь реализовать сценарий транскрипции, в котором вызывающий будет говорить строку букв и цифр, но логика из коробки, кажется,...
521 просмотров

Точка доступа Google Cloud для преобразования речи в текст
Я использую точку доступа Google Cloud Speech-to-Text и пытаюсь расшифровать длинный аудиофайл, однако аудиофайл из корзины не может быть обнаружен. Я получаю сообщение об ошибке: IOError: [Errno 2] Нет такого файла или каталога: def...
199 просмотров
schedule 10.12.2022

Мем-микрофон Adafruit I2S не работает с распознаванием речи Contune. (API Google Cloud Speech)
Я использую эту библиотеку с Raspberry pi 3 с Mems-микрофоном Raspbian и Adafruit I2S. Я могу работать с микрофоном i2s с raspberry pi, и он отлично работает для нормальной записи, но при использовании Speech_Recognition с Google Speech Cloud API...
445 просмотров

Распознавание речи Python listen_in_background при нажатии кнопки?
В настоящее время я пытаюсь заставить модуль voice_recognition слушать в фоновом режиме, когда пользователь нажимает кнопку, созданную с помощью py qt. У меня есть методы инициализации и обратного вызова в классе, однако, когда я пытаюсь прослушать...
2515 просмотров
schedule 13.11.2022

Преобразование видео в текст (стенограмма) с помощью облачной речи Google в текст с помощью приложения Rails
Работа над WebAppon Ruby on Rails. Я хочу получить субтитры для предварительно записанного видео, а также для новых видео, которые собираются записать. Я реализовал gem 'google-cloud-speech' . Но теперь я не могу получить текст для своего...
343 просмотров

Проблема с потоковой передачей звука в Python с микрофона через MQTT в Google Streaming с использованием генераторов
Я прочитал документацию Google и просмотрел их examples , однако мне не удалось заставить это работать правильно в моем конкретном случае использования. Проблема в том, что пакеты аудиопотока разбиваются на более мелкие фрагменты (размер кадра),...
387 просмотров

Минимально приемлемое качество звука для Google Speech API (и как его настроить)
Я работаю с Speech API и хочу настроить службу для сред с низкой пропускной способностью. Я заметил, что параметры качества звука настраиваются в двух местах в примере кода: Первый в AudioEmitter.kt fun start( encoding: Int =...
149 просмотров
schedule 11.06.2023

Как показать показатель уверенности на уровне слов в Google Speech API
Я включил Google Speech API в облачные функции. Я хочу получить оценку достоверности на уровне слов, поэтому я установил для enableWordConfidence значение true. По какой-то причине ответ не возвращает оценку достоверности на уровне слов. Я...
327 просмотров
schedule 23.04.2023