У меня были отличные результаты с Google API для распознавания речи с естественными диалогами, однако для звуков из Распознавание видео или фильмов на Youtube плохое или отсутствует.
Запись звуков на iPhone 4 моего голоса как на испанском, так и на английском распознается, но с того же телефона в кино почти невозможно, даже сцена с персонажем, говорящим с небольшим фоновым шумом. Только однажды имел успех.
Я пытаюсь очистить звук с помощью SoX (Sound eXchange) с помощью шумовых и компандных эффектов, но безуспешно.
Есть идеи? Или просто звуки, которые не могут быть идентифицированы API Google для большего количества изменений? Будет ли он иметь больший успех с другим программным обеспечением для распознавания речи?