Italian

Flat
help me creare un modello acustico in italiano
User: dantavo
Date: 11/28/2013 3:41 am
Views: 14184
Rating: 8

Salve a tutti spero qualcuno possa aiutarmi.

Sto lavorando su un piccolo progettino per la mia tesi di laurea usando Sphinx4 (obbligatoriamente).

Ho letto un bel pò di roba su internet e su questo forum, ma tutti sorvolano una cosa (o sono io che non riesco ad afferrarla). 

Come faccio praticamente e non teoricamente (perchè fin li ci sono :) ) a creare un modello acustico di 10 -15 parole secche e utilizzarlo su sphinx4.

Quale tool posso usare per crearlo? come lo do in pasto a sphinx?

Ho a mia disposizione i file wave già registrati e le trascrizioni.

Grazie

Re: help me creare un modello acustico in italiano
User: nsh
Date: 11/28/2013 6:28 am
Views: 210
Rating: 8

Condividere i file con Dropbox e avrai il tuo modello

Re: help me creare un modello acustico in italiano
User: dantavo
Date: 11/28/2013 10:35 am
Views: 149
Rating: 8

Grazie.

Io sto preparando i file .wav con dentro le parole che mi serve riconoscere e per ognuna di queste sto raccogliendo circa 6/7 registrazioni di persone diverse. 

Per la creazione del modello serve darti altro? 

Come preferisci venga creato il file dove indico cosa contengono le registrazioni?

SI <list_of_files> NO <list_of_files> CERTO <list_of_files> etc..

oppure

<s> SI </s> (nome_file) etc..

 i file audio sono qui:

https://www.dropbox.com/s/u9ri4e5c4uzpre0/file_wav_for_acoustic_model.zip

Re: help me creare un modello acustico in italiano
User: nsh
Date: 11/28/2013 5:40 pm
Views: 221
Rating: 8

You can download a model training folder with pretrained model here:

http://alphacephei.com/test/sino.zip

The model is in the folder sino/model_parameters/sino.cd_cont_100

Overall you do not have enough data to train the acoustic model. You need way more data, at least 50 speakers, not 4 and each speaker should say same word several times.

 

Re: help me creare un modello acustico in italiano
User: dantavo
Date: 11/29/2013 2:53 am
Views: 190
Rating: 5

Ok thank you for all..

I've tried the model unfortunately don't run well, but you was fantastic thank you.

I'll try to find this amount of data, i've to find it :).

I will send you this file but if is possible can you explain me how to create an acoustic model for sphinx4?  

Is so difficult to realize?

Could you explain me the steps i've to follow? 

Re: help me creare un modello acustico in italiano
User: nsh
Date: 11/29/2013 1:28 pm
Views: 294
Rating: 7

This is very simple, you can just follow the documentation and modify the configuration file to load the model from the training folder. You need to modify grammar location, dictionary location, model location and update melfilterbank parameters.

You can unpack sino-data folder with all data required to sphinx4 top level folder and replace Transcriber.java and config.xml in the Transcriber demo of sphinx4.

You can find complete example with all the modifications and all required data files here:

http://alphacephei.com/test/sino-s4.zip

If you modify the transcriber demo properly the results will be:

si

si si

ok

affermativo

confermo

sbagliato

certo

va bene

corretto

ovviamente

perfetto

certamente

assolutamente si

si

no

no no

sbagliato

affermativo

non confermo

per niente

assolutamente no

non va bene

non e' corretto

rifiuto

ok

Re: help me creare un modello acustico in italiano
User: dantavo
Date: 12/3/2013 3:23 am
Views: 169
Rating: 8

thank youuu very much for your reply, you are great :D

Now i'm trying to create my own acustic model using the guide.

I created the language model using the tutoriallm. I have the arpa model (.vocab ; .lm.DMP) and now i want to create a little acoustic model using new training database.

My question is:

How can I create my new training database?In particular i need to produce  files under etc directory ( .dic ; .transcription ; .fileid ; .filler).

When you created "sino" database, did you use some particular framework or tool to produce these files? (such as phonetisaurus, sequitur-g2p). 

Thanks in advance 

 

 

Re: help me creare un modello acustico in italiano
User: nsh
Date: 12/5/2013 6:00 pm
Views: 345
Rating: 6

> When you created "sino" database, did you use some particular framework or tool to produce these files? (such as phonetisaurus, sequitur-g2p). 

You can use your favorite scripting language (Python, Ruby) to process text files to put them in a certain format. Also you can use your favourite text editor.

Italian dictionary doens't require phonetisaurus though you can use it to extend the dictionary. The original dictionary is from the Italian Festival project:

https://sourceforge.net/projects/it-festival

It's pretty comprehensive.

 

Re: help me creare un modello acustico in italiano
User: dantavo
Date: 12/9/2013 4:04 am
Views: 138
Rating: 6

Thank you for your reply.

Now I've two problems:

The first one is:

While I try to launch this command:

/usr/local/lib/sphinxtrain/scripts/000.comp_feat/make_feats.pl  -ctl  etc/sino_train.fileids

I got this error:

"This step had 2 ERROR messages and 0 WARNING messages.  Please check the log file for details." and my log file is empty.

Any suggestions?

The second one:

The .dic structure is differt from the festival "lex.out" file where the dictionary is placed.

How I can get a sphinx .dic file starting from festival installation ?   

Re: help me creare un modello acustico in italiano
User: nsh
Date: 12/9/2013 6:19 am
Views: 140
Rating: 7

> /usr/local/lib/sphinxtrain/scripts/000.comp_feat/make_feats.pl  -ctl  etc/sino_train.ï¬Âleids

This command is wrong, you probably took it from obsolete source, the correct command is just:
    sphinxtrain run
For more details on proper training process see the tutorial http://cmusphinx.sourceforge.net/wiki/tutorialam
Make sure you have the latest version of sphinxtrain installed
> "This step had 2 ERROR messages and 0 WARNING messages.  Please check the log file for details." and my log file is empty.
Logs are created in logdir folder

> The .dic structure is differt from the festival "lex.out" file where the dictionary is placed. 

Yes

> How I can get a sphinx .dic file starting from festival installation ?   

You need to convert formats, you can do it using your favorite scripting language (Python, Ruby, etc).

 

 

 

PreviousNext