Вопросы по теме 'google-cloud-speech'

Какие типы звука поддерживаются Cloud Speech API?
Существует множество аудиоформатов (например, mp3, m4a), источников (например, диктовка, команды, телефонные звонки, встречи) и устройств (например, телефоны, ПК, устройства IoT). Какие из них лучше всего работают с Cloud Speech API?
747 просмотров
schedule 27.02.2023

Результат API распознавания речи Google пуст
Я выполняю асинхронный запрос к Google Cloud Speech API и не знаю, как получить результат операции: Запрос POST: https://speech.googleapis.com/v1beta1/speech:asyncrecognize Тело: { "config":{ "languageCode" :...
9867 просмотров

Неверная полезная нагрузка json для запроса syncrecognize curl
Я подписался на https://cloud.google.com/speech/docs/getting-started и успешно запустился curl -s -k -H "Content-Type: application/json" \ -H "Authorization: Bearer access_token" \ https://speech.googleapis.com/v1beta1/speech:syncrecognize \ -d...
821 просмотров
schedule 30.12.2022

Образцы Cloud Speech API для тестового примера Java выдают исключение: Причина: java.net.UnknownHostException: account.google.com
Я пытаюсь использовать Google Cloud Speech API для распознавания речи, следуя примеру кода на https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech/grpc Я следовал инструкциям и создал учетные данные (ключ сервисной...
529 просмотров

Почему время отклика API для распознавания аудиопотока такое медленное?
Я использую код, очень похожий на пример Google для распознавания речи на Аудиопоток с использованием клиентской библиотеки Node.js. API правильно анализирует мой звук, но я жду 30-45 секунд, прежде чем получу ответ. Учитывая, насколько быстрой...
331 просмотров
schedule 18.01.2023

Google cloud -speech API возвращает нулевой результат
Я работаю с Google Cloud Voice API. Когда я запускаю свой скрипт, происходит вызов API и ответ. Информация об операции возвращает данные, но результат пуст. Вот мой код (где URL-адрес файла, имя файла, URL-адрес ключа, имя проекта и имя корзины я...
1050 просмотров
schedule 14.10.2022

Ошибка облачного асинхронного распознавания речи с Python на терминале
Я потратил около 3 дней на эту же проблему. По сути, я пытаюсь использовать api облачной речи Google, чтобы сделать грубую транскрипцию моего аудиофайла, расположенного по адресу gs: //architecture-transcript-1/architecture.flac.Файл ранее был m4a,...
765 просмотров
schedule 04.05.2023

Как выделить слова-паразиты (Гм, э, а) в стенограмме?
Есть ли конфигурация в облачной речи Google, которая позволяет мне видеть слова-заполнители в возвращенной стенограмме JSON? В настоящее время кажется, что расшифровка, возвращаемая облачной речью Google, автоматически отфильтровывает такие слова...
779 просмотров
schedule 31.07.2023

google-cloud-speech speech.types.RecognitionConfig
В настоящее время я работаю на Debian 8 Jessie с Python 2.7 и текущими облачными речью и хранилищем Google (с обновлением сегодня). Когда я пытаюсь настроить, это не удается: ValueError: сообщение протокола RecognitionConfig не имеет поля...
524 просмотров
schedule 19.10.2023

Google Speech API не принимает большие аудиофайлы
Я получаю сообщение об ошибке сервера при попытке обработать большие аудиофайлы. Изначально аудиофайлы имеют формат audio / m4a @ 32kHz, и в соответствии с рекомендациями документации я конвертирую / сжимаю их в audio / amr_wb @ 16kHz. Эти файлы...
704 просмотров
schedule 25.08.2022

Не удалось загрузить библиотеки: [netty_tcnative_linux_arm_32, netty_tcnative_linux_arm_32_fedora, netty_tcnative_arm_32, netty_tcnative]
Я пытаюсь запустить java-приложение, используя jar на Raspberry Pi Modal 3. Я не могу решить эту проблему. Может ли кто-нибудь подсказать, как я могу заставить это работать на Raspberry Pi? В pom я включил зависимость от google-cloud-speech,...
1420 просмотров

Google Cloud Speech API - ошибка разрешения
API уже включен в консоли, по-прежнему появляется эта ошибка. data:{ error:{ code:403, message:'Cloud Speech API has not been used in project ************ before or it is disabled. Enable it by visiting...
162 просмотров
schedule 03.10.2022

Речь Google Cloud очень неточная и пропускает слова на чистом аудио
Я использую облачную речь Google через Python и обнаружил, что многие транскрипции неточны и отсутствуют несколько слов. Это простой скрипт, который я использую для возврата расшифровки аудиофайла, в данном случае out307.wav: client =...
79 просмотров
schedule 25.11.2022

'en-GB-Wavenet-C' не работает [преобразование текста в речь Google Cloud]
Я новичок в программировании. Я использую Google Cloud Text to Speech API для Python в небольшой программе, которую использую. Функция работает, и я получаю результаты синтезированного голоса, но файл MP3 отличается от того, что мне нужно. В...
786 просмотров

Google Speech-to-text API, InvalidArgument: 400 Необходимо использовать одноканальный (моно)
Я продолжаю получать эту ошибку InvalidArgument: 400 в Google Speech-to-text, и проблема, похоже, в том, что я использую двухканальный звук (Stereo), а API ожидает wav в (Mono). Если я конвертирую файл в аудиоредакторе, он может работать, но я не...
6439 просмотров
schedule 17.01.2023

MP3 AudioEncoding не работает, я сейчас использую v1beta1?
Я пытаюсь транскрибировать аудио из потока с помощью этого руководства (раздел «Выполнение потокового распознавания речи в локальном файле»): https://cloud.google.com/speech-to-text/docs/потоковоераспознавание Файл представляет собой файл M3U,...
401 просмотров
schedule 07.05.2023

Google Speech для текстовых разных результатов с помощью API и веб-сайта
Я использую API преобразования речи в текст Google для расшифровки аудио. Недавно я попробовал некоторые из своих аудиофайлов на веб-сайте Google ASR и получил разные результаты. . Есть идеи, почему это так? Выполняет ли Google некоторую...
43 просмотров
schedule 20.09.2022

Google Cloud Speech-to-Text: INVALID_ARGUMENT: неверная конфигурация распознавания: неверная кодировка... ошибка кодека аудиокодека
Я записываю короткие аудиофайлы (несколько секунд) в Chrome с помощью mediaDevices.getUserMedia() , сохраняю файл в хранилище Firebase, а затем пытаюсь отправить файлы в Google Cloud Speech-to-Text из облачной функции Firebase. Я получаю обратно это...
219 просмотров
schedule 14.06.2023