Публикации по теме google-cloud-speech

Вопросы по теме 'google-cloud-speech'

Какие типы звука поддерживаются Cloud Speech API?

Существует множество аудиоформатов (например, mp3, m4a), источников (например, диктовка, команды, телефонные звонки, встречи) и устройств (например, телефоны, ПК, устройства IoT). Какие из них лучше всего работают с Cloud Speech API?

747 просмотров

google-cloud-speech

27.02.2023

Результат API распознавания речи Google пуст

Я выполняю асинхронный запрос к Google Cloud Speech API и не знаю, как получить результат операции: Запрос POST: https://speech.googleapis.com/v1beta1/speech:asyncrecognize Тело: { "config":{ "languageCode" :...

9867 просмотров

google-api speech-recognition google-cloud-speech

25.06.2023

Неверная полезная нагрузка json для запроса syncrecognize curl

Я подписался на https://cloud.google.com/speech/docs/getting-started и успешно запустился curl -s -k -H "Content-Type: application/json" \ -H "Authorization: Bearer access_token" \ https://speech.googleapis.com/v1beta1/speech:syncrecognize \ -d...

821 просмотров

curl wget google-cloud-speech

30.12.2022

Образцы Cloud Speech API для тестового примера Java выдают исключение: Причина: java.net.UnknownHostException: account.google.com

Я пытаюсь использовать Google Cloud Speech API для распознавания речи, следуя примеру кода на https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech/grpc Я следовал инструкциям и создал учетные данные (ключ сервисной...

529 просмотров

google-cloud-platform java google-cloud-speech

08.05.2023

Почему время отклика API для распознавания аудиопотока такое медленное?

Я использую код, очень похожий на пример Google для распознавания речи на Аудиопоток с использованием клиентской библиотеки Node.js. API правильно анализирует мой звук, но я жду 30-45 секунд, прежде чем получу ответ. Учитывая, насколько быстрой...

331 просмотров

node.js google-cloud-speech

18.01.2023

Google cloud -speech API возвращает нулевой результат

Я работаю с Google Cloud Voice API. Когда я запускаю свой скрипт, происходит вызов API и ответ. Информация об операции возвращает данные, но результат пуст. Вот мой код (где URL-адрес файла, имя файла, URL-адрес ключа, имя проекта и имя корзины я...

1050 просмотров

php encoding google-cloud-speech

14.10.2022

Ошибка облачного асинхронного распознавания речи с Python на терминале

Я потратил около 3 дней на эту же проблему. По сути, я пытаюсь использовать api облачной речи Google, чтобы сделать грубую транскрипцию моего аудиофайла, расположенного по адресу gs: //architecture-transcript-1/architecture.flac.Файл ранее был m4a,...

765 просмотров

python gcloud google-cloud-speech

04.05.2023

Как выделить слова-паразиты (Гм, э, а) в стенограмме?

Есть ли конфигурация в облачной речи Google, которая позволяет мне видеть слова-заполнители в возвращенной стенограмме JSON? В настоящее время кажется, что расшифровка, возвращаемая облачной речью Google, автоматически отфильтровывает такие слова...

779 просмотров

ruby google-cloud-speech

31.07.2023

google-cloud-speech speech.types.RecognitionConfig

В настоящее время я работаю на Debian 8 Jessie с Python 2.7 и текущими облачными речью и хранилищем Google (с обновлением сегодня). Когда я пытаюсь настроить, это не удается: ValueError: сообщение протокола RecognitionConfig не имеет поля...

524 просмотров

config google-cloud-speech

19.10.2023

Google Speech API не принимает большие аудиофайлы

Я получаю сообщение об ошибке сервера при попытке обработать большие аудиофайлы. Изначально аудиофайлы имеют формат audio / m4a @ 32kHz, и в соответствии с рекомендациями документации я конвертирую / сжимаю их в audio / amr_wb @ 16kHz. Эти файлы...

704 просмотров

google-cloud-speech

25.08.2022

Не удалось загрузить библиотеки: [netty_tcnative_linux_arm_32, netty_tcnative_linux_arm_32_fedora, netty_tcnative_arm_32, netty_tcnative]

Я пытаюсь запустить java-приложение, используя jar на Raspberry Pi Modal 3. Я не могу решить эту проблему. Может ли кто-нибудь подсказать, как я могу заставить это работать на Raspberry Pi? В pom я включил зависимость от google-cloud-speech,...

1420 просмотров

java grpc-java google-cloud-speech netty raspberry-pi3

12.02.2024

Google Cloud Speech API - ошибка разрешения

API уже включен в консоли, по-прежнему появляется эта ошибка. data:{ error:{ code:403, message:'Cloud Speech API has not been used in project ************ before or it is disabled. Enable it by visiting...

162 просмотров

google-cloud-speech

03.10.2022

Речь Google Cloud очень неточная и пропускает слова на чистом аудио

Я использую облачную речь Google через Python и обнаружил, что многие транскрипции неточны и отсутствуют несколько слов. Это простой скрипт, который я использую для возврата расшифровки аудиофайла, в данном случае out307.wav: client =...

79 просмотров

google-cloud-speech

25.11.2022

'en-GB-Wavenet-C' не работает [преобразование текста в речь Google Cloud]

Я новичок в программировании. Я использую Google Cloud Text to Speech API для Python в небольшой программе, которую использую. Функция работает, и я получаю результаты синтезированного голоса, но файл MP3 отличается от того, что мне нужно. В...

786 просмотров

google-cloud-platform text-to-speech google-cloud-speech google-text-to-speech

18.06.2023

Google Speech-to-text API, InvalidArgument: 400 Необходимо использовать одноканальный (моно)

Я продолжаю получать эту ошибку InvalidArgument: 400 в Google Speech-to-text, и проблема, похоже, в том, что я использую двухканальный звук (Stereo), а API ожидает wav в (Mono). Если я конвертирую файл в аудиоредакторе, он может работать, но я не...

6439 просмотров

python google-cloud-speech

17.01.2023

MP3 AudioEncoding не работает, я сейчас использую v1beta1?

Я пытаюсь транскрибировать аудио из потока с помощью этого руководства (раздел «Выполнение потокового распознавания речи в локальном файле»): https://cloud.google.com/speech-to-text/docs/потоковоераспознавание Файл представляет собой файл M3U,...

401 просмотров

google-cloud-speech

07.05.2023

Google Speech для текстовых разных результатов с помощью API и веб-сайта

Я использую API преобразования речи в текст Google для расшифровки аудио. Недавно я попробовал некоторые из своих аудиофайлов на веб-сайте Google ASR и получил разные результаты. . Есть идеи, почему это так? Выполняет ли Google некоторую...

43 просмотров

google-cloud-speech

20.09.2022

Google Cloud Speech-to-Text: INVALID_ARGUMENT: неверная конфигурация распознавания: неверная кодировка... ошибка кодека аудиокодека

Я записываю короткие аудиофайлы (несколько секунд) в Chrome с помощью mediaDevices.getUserMedia() , сохраняю файл в хранилище Firebase, а затем пытаюсь отправить файлы в Google Cloud Speech-to-Text из облачной функции Firebase. Я получаю обратно это...

219 просмотров

google-cloud-speech getusermedia

14.06.2023