Как выделить слова-паразиты (Гм, э, а) в стенограмме?

Есть ли конфигурация в облачной речи Google, которая позволяет мне видеть слова-заполнители в возвращенной стенограмме JSON? В настоящее время кажется, что расшифровка, возвращаемая облачной речью Google, автоматически отфильтровывает такие слова (э-э, гм, а, как и т. д.).

Я попытался использовать параметр «фразы» в своем вызове распознавания звука, который делает акцент на обнаружении определенных фраз в аудио.

wordsToDetect = ["um", "like", "so", "honestly", "basically", "actually", "uh"]

audio = speech.audio output_filepath,
                     encoding: :flac,
                     language: "en-US"

results = audio.recognize phrases: wordsToDetect

Дело в том, что Google Cloud Speech просто автоматически отфильтровывает слова-заполнители, такие как «гм» ​​и «э-э-э»?


person jerryhdev    schedule 27.11.2017    source источник


Ответы (1)


Почти все API-интерфейсы распознавания речи не могут обнаруживать звуки-наполнители, такие как Ahs, Ums, Uhs и т. д. Чтобы обнаруживать эти звуки, алгоритм должен быть обучен для обнаружения этих конкретных звуков.

person Abhishek    schedule 13.09.2018
comment
Можете ли вы рассказать о каком-нибудь хорошем подходе к обнаружению звуков-наполнителей, как указано в вопросах? - person Sumit Jangra; 10.07.2020