Нужно ли мне добавлять обновленную последовательность слов фонем в файл .dict при адаптации AM с помощью cmusphinx?

Я пытаюсь адаптировать акустическую модель en-us с записями с индийским английским акцентом. Поскольку многие слова произносятся с разным акцентом, нужно ли добавлять обновленное представление фонем слов? В настоящее время я перехожу по этой ссылке: https://cmusphinx.github.io/wiki/tutorialadapt/#accumulating-observation-counts, и здесь ничего не говорится об обновлении файла .dict.

PS: Должен ли я добавлять новые слова прямо в словарь?


person Sumit Jangra    schedule 10.04.2019    source источник


Ответы (1)


В загрузках есть индийская английская модель, вы должны использовать ее вместо этого. Он поставляется со словарем индийского английского языка.

person Nikolay Shmyrev    schedule 10.04.2019
comment
Спасибо, проверим. Что, если в этой модели я тоже захочу добавить несколько новых слов? - person Sumit Jangra; 10.04.2019
comment
Еще один момент: можем ли мы обучить модель на данных дочерних элементов en-us, а затем использовать ее для дочерних элементов en-in. Будет ли это работать с хорошей точностью или нам нужны только данные о детях en-in? Заранее спасибо. - person Sumit Jangra; 11.04.2019
comment
Для наилучшей точности вы должны тренироваться на детских данных en-in. - person Nikolay Shmyrev; 11.04.2019
comment
Предположим, я просто хочу распознать около 50 основных слов, сколько данных требуется? Сейчас у меня только 50 записей для каждого слова. У меня есть два варианта 1) Адаптировать модель 2) Обучить новую модель, но я не знаю, достаточно ли у меня данных для обучения и построения модели. - person Sumit Jangra; 16.04.2019
comment
Вы должны тренироваться, чтобы распознавать детские голоса. Вам нужно 50 часов речи, чтобы натренировать хорошую систему. - person Nikolay Shmyrev; 16.04.2019