Как создать файл .dic для турецкого языка в cmusphinx

Я установил «sphinxbase» и «pocketsphinx» в Windows и запустил «PocketSphinxDemo» в eclipse и на своем телефоне. Далее я хочу создать турецкий язык для этого приложения. Достаточно понять несколько слов или предложений в качестве начала, чтобы это было легко. Готовую турецкую модель на Voxforge не нашел. Есть ли какой-либо другой веб-сайт, который я могу найти, или какой-либо инструмент, который я могу легко создать.

Я использовал imtool, но произношение файла dic английское. Как я могу создать файл dic для турецкого языка.


person g1904    schedule 27.03.2013    source источник


Ответы (1)


Вам нужен список слов в первую очередь. После этого вы можете использовать правила espeak для создания фонетического словаря:

espeak -v tr -x
Türkçe 
tYRktS'E

Вам нужно только проанализировать вывод и поместить его в словарь только в альфа-формате. Вам просто нужно создать карту для телефонного аппарата, состоящего только из букв, нет необходимости в карте для arpabet. Откройте текстовую панель и создайте карту:

t t
y yy
r rr
k k
e ee
S' sh

Итак, в конце вы получите такие записи:

türkçe t yy rr k t sh ee

Вот и все. Нет необходимости использовать ARPABet. Дополнительные сведения см. в учебном руководстве по акустической модели.

person Nikolay Shmyrev    schedule 28.03.2013
comment
Я использовал espeak и сгенерировал символы слов ipa. Теперь, как я могу преобразовать их в формат CMU sphinx phoneset ARPABet. - person g1904; 04.04.2013
comment
Нет необходимости привязываться к ARPAbet, вам нужна только случайная привязка к телефонному аппарату только с буквами. Я обновил ответ примером. - person Nikolay Shmyrev; 05.04.2013
comment
Как я могу сопоставить эти символы? большой R означает rr, маленький r означает r, S' означает sh, насколько я понимаю. как насчет 'a или @ означает и т.д.. как я могу их найти. - person g1904; 05.04.2013
comment
Вы можете выбрать любое разумное сопоставление, если оно уникально. Например, сопоставьте a с a и @ с ax. Раскройте свой ум. - person Nikolay Shmyrev; 05.04.2013