Архитектура WebkitSpeechRecognition

Я знаю, что WebkitSpeechRecognition доступен только в браузере Chromium. Однако мне интересно, как он преобразует голос в текст?

Я пытался отслеживать сетевой журнал с консоли разработчика в Google Chrome, и я не вижу никакой сетевой активности. Я думал, что отправлю запрос API в Google, но я действительно этого не делаю.

Я также не могу найти ни одного архитектурного документа по этому поводу.

Есть ли у кого-нибудь идеи?

webspeech-api webkitspeechrecognition

Paresh Varde 04.10.2016 источник

comment

просматривая сетевой трафик на Telerik Fiddler, я вижу, что он взаимодействует с Google API. Однако он возвращается с плохим запросом! - Paresh Varde 05.10.2016

Ответы (1)

arrow_upward
1
arrow_downward

насколько мне известно, нет официальной документации для Google Speech API, который используется в Chromium, но он был «обратно спроектирован» путем проверки исходный код Chromium

когда вы ищете его, вы должны найти несколько блогов / руководств, в которых описывается, как можно использовать REST API.

хорошее описание того, как его использовать, можно найти здесь

http://blog.travispayton.com/wp-content/uploads/2014/03/Google-Speech-API.pdf

(что касается описания в PDF: упомянутый «Речевой API V1» на данный момент деактивирован, поэтому можно использовать только «Полнодуплексный API»)

Но обратите внимание, что вам нужен ключ API через Консоль разработчика Google (для Speech API); а для этого вам необходимо зарегистрироваться на Chromium Development Группа. Кроме того, используя свой собственный ключ, на данный момент Speech API ограничен 50 транзакциями в день.

russa 09.01.2017

Архитектура WebkitSpeechRecognition

Ответы (1)

Вопросы по теме