Как выделить слова-паразиты (Гм, э, а) в стенограмме?

Есть ли конфигурация в облачной речи Google, которая позволяет мне видеть слова-заполнители в возвращенной стенограмме JSON? В настоящее время кажется, что расшифровка, возвращаемая облачной речью Google, автоматически отфильтровывает такие слова (э-э, гм, а, как и т. д.).

Я попытался использовать параметр «фразы» в своем вызове распознавания звука, который делает акцент на обнаружении определенных фраз в аудио.

wordsToDetect = ["um", "like", "so", "honestly", "basically", "actually", "uh"]

audio = speech.audio output_filepath,
                     encoding: :flac,
                     language: "en-US"

results = audio.recognize phrases: wordsToDetect

Дело в том, что Google Cloud Speech просто автоматически отфильтровывает слова-заполнители, такие как «гм» и «э-э-э»?

ruby google-cloud-speech

jerryhdev 27.11.2017 источник

Ответы (1)

arrow_upward
0
arrow_downward

Почти все API-интерфейсы распознавания речи не могут обнаруживать звуки-наполнители, такие как Ahs, Ums, Uhs и т. д. Чтобы обнаруживать эти звуки, алгоритм должен быть обучен для обнаружения этих конкретных звуков.

Abhishek 13.09.2018

comment

Можете ли вы рассказать о каком-нибудь хорошем подходе к обнаружению звуков-наполнителей, как указано в вопросах? - Sumit Jangra; 10.07.2020

Как выделить слова-паразиты (Гм, э, а) в стенограмме?

Ответы (1)

Вопросы по теме