Архитектура WebkitSpeechRecognition

Я знаю, что WebkitSpeechRecognition доступен только в браузере Chromium. Однако мне интересно, как он преобразует голос в текст?

Я пытался отслеживать сетевой журнал с консоли разработчика в Google Chrome, и я не вижу никакой сетевой активности. Я думал, что отправлю запрос API в Google, но я действительно этого не делаю.

Я также не могу найти ни одного архитектурного документа по этому поводу.

Есть ли у кого-нибудь идеи?


person Paresh Varde    schedule 04.10.2016    source источник
comment
просматривая сетевой трафик на Telerik Fiddler, я вижу, что он взаимодействует с Google API. Однако он возвращается с плохим запросом!   -  person Paresh Varde    schedule 05.10.2016


Ответы (1)


насколько мне известно, нет официальной документации для Google Speech API, который используется в Chromium, но он был «обратно спроектирован» путем проверки исходный код Chromium

когда вы ищете его, вы должны найти несколько блогов / руководств, в которых описывается, как можно использовать REST API.

хорошее описание того, как его использовать, можно найти здесь

http://blog.travispayton.com/wp-content/uploads/2014/03/Google-Speech-API.pdf

(что касается описания в PDF: упомянутый «Речевой API V1» на данный момент деактивирован, поэтому можно использовать только «Полнодуплексный API»)

Но обратите внимание, что вам нужен ключ API через Консоль разработчика Google (для Speech API); а для этого вам необходимо зарегистрироваться на Chromium Development Группа. Кроме того, используя свой собственный ключ, на данный момент Speech API ограничен 50 транзакциями в день.

person russa    schedule 09.01.2017