Распознавание голоса Google в фильмах

У меня были отличные результаты с Google API для распознавания речи с естественными диалогами, однако для звуков из Распознавание видео или фильмов на Youtube плохое или отсутствует.

Запись звуков на iPhone 4 моего голоса как на испанском, так и на английском распознается, но с того же телефона в кино почти невозможно, даже сцена с персонажем, говорящим с небольшим фоновым шумом. Только однажды имел успех.

Я пытаюсь очистить звук с помощью SoX (Sound eXchange) с помощью шумовых и компандных эффектов, но безуспешно.

Есть идеи? Или просто звуки, которые не могут быть идентифицированы API Google для большего количества изменений? Будет ли он иметь больший успех с другим программным обеспечением для распознавания речи?


person Marcos Castillo    schedule 03.06.2013    source источник


Ответы (1)


Распознаватель голоса Google (и большинство других распознавателей) несовместим с эффектами реверберации. В большинстве видеосцен расстояние между человеком и микрофоном превышает 1-3 метра. Попробуйте положить телефон на стол и распознать что-либо с расстояния 3 метров. Это ни к чему не приведет, но качество звука будет очень хорошим.

person Rai220    schedule 25.07.2014