Spanish

Nested
Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 12:56 pm
Views: 61
Rating: 1

Mas noticias...

Acabo de terminar el proceso semi automatico que implementaste y funciona de mil maravillas!!!, gracias ahorra muchisimo tiempo y es muy emocionante ver palabras correctamente reconocidas, pero tengo algunas preguntas:

- como saber cuales de todas las palabras grabadas en las frases son reconocidad?, solo probando?

- cual es el estado actual de tus pruebas?, veo que al decir algunas palabras julius se queja sobre triphones, asumo que todavia no se hace el proceso para los triphonos?

- voy a ver de hacer el script3 para crear el modelo para "sp" para aportarte en algo, o ya lo tienes hecho?

- como podemos vanzar en un proceso que automatice desde la construccion de un diccionario "deseado", es decir "esto es lo que quiero que se reconozca", pasando por grabar las frases y cantidad adecuadas para reconocer esas palabras?

Respecto a mi sesion de voz he intentado subirla 2 veces y ambas han fallado, voy a intentar un poco mas tarde desde casa, de todas formas una vez arriba te agradeceria me dijieras si es de la calidad esperada..

Respecto al gnome-voice-control, para que reconozca español, revisando mis archivos solo puedo decirte que Nickolay de CMUSphinx no me informo mucho de como lo hacia, solo me pidio un diccionario en español con los correspondientes phonemas, pero solo para las palabras soportadas por gnome-voice-control (tipo "abrir editor de texto", etc..). Para eso me paso el link del Dr.Nolazco en el sitio de CMUSphinx:

http://www.speech.cs.cmu.edu/sphinx/models/hub4spanish_itesm/

que me parece ya revisaste.Entonces me base en ese diccionario, luego me pidio enviarselo y al parecer el genero el modelo, seguramente tiene herramientas automaticas como las tuyas), luego de esto me paso los archivos que tengo en la carpeta voxforge-es que te adjunto y que se debe copiar en la ruta:

/usr/share/pocketsphinx/model

(por supuesto se debe tener sphinx y pocketsphinx instalados con las ultimas fuentes desde el repositorio)

Avisame si quieres probar el gnome-voice-control en español o si tienes problemas para compilarlo (suele ser un desafio dependiendo de que tan rotas tienen las fuentes en el repo)...

Seria bueno integrar tu trabajo y el de gnome-voice-control, puesto que este ultimo ya hace el trabajo de comunicarse con la capa de accesibilidad de gnome, por lo tanto una persona podria entrenar su propia voz (para mas presicion a falta de un modelo acustico general de buena calidad), con el grupo de palabras/comando que desee controlar y luego integrar eso a gnome-voice-control para la accion final (mover raton arriba,etc..)

Saludos y espero poder colaborar mas en lo futuro.

Mauricio

 

 

voxforge-es.tar.gz voxforge-es.tar.gz
Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 4:38 pm
Views: 118
Rating: 10

Hi Ken,

Mauricio tells that in some of the recordings there is a "chick" noise at the beginning of his phrases (may be noise generated by his keyboard). Could this noise afect to the training process?

Could it be removed in some easy way (may be some program that let you remove the first two seconds of a wav).

Thanks in advance

Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 4:42 pm
Views: 99
Rating: 10

The record script (it's not made by me), first make a record, then executes aplay for you to listen the saved wav. When you press any key the script kill the aplay process. If you have heared all the wav then there is no process to kill and it gives this error... but nothing happens and it works ok.

 

Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 5:15 pm
Views: 107
Rating: 1

Este es muy largo para contestarlo en inglés... vamos a tomar el camino fácil y utilizar nuestra lengua :-P

I have the script changed in order to make all the process automatically. I have attached you the new script (see the auto/script_auto script).

The julian configuration, now is a bit more complex (the grammar).

If you want to recognize more words, first of all you should try to  change the files sample.voca and sample.grammar (then compile and run julian).

If you get that some triphones are missing. Then prepare new phrases containing the words you want to recognize. Record the phrases and change the files auto/prompts, auto/codetrain.scp, auto/train.scp, and lexicon/voxforge_lexicon_spanish if some word is missing.

Then run script_auto again.

Now I have added all the phrases that appear in voxforge (spanish) to the training process. Tomorrow I will add the phrases from mauricio.

Me he cansado del inglés :-) los triphones si son creados, pero hay miles y miles de ellos... (un triphone es la unión de tres fonemas, imagina la cantidad de ellos que pueden aparecer). Yo creo que hace falta muchas horas de conversación para meterle al training, y también haría falta el meter más frases conteniendo más triphones. Por último me faltaría el training de los ruidos... lo más dificil de todo es el llegar a conseguir unas 140horas de grabación para poder empezar a hacer un reconocimiento multiusuario decente.

Yo herramientas tengo 4 mierdaprogramas que he desarrollado yo para ayudarme....

Yo por ahora estoy haciendo el reconocimiento para julius (la única comparativa que he leído dice que tiene mayor ratio de acierto a la hora de reconocer y puestos a elegir, pues elegí julius...)

Si me interesaría probar el gnome-voice-control en castellano. Qué modelo acústico ha empleado? el del dr.nolazco?

Otro día más que me voy a dormir :-P

Un saludo.

 

 

train_spanish_3.01.tgz train_spanish_3.01.tgz
Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 5:21 pm
Views: 51
Rating: 1

sip, me parece que el modelo empleado es el del dr.nolazco...espero poder probar el metodo que me indicas con un diccionario reducido de palabras tipo "command and control" para tratar de manejar el pc..

 

Saludos

Mauricio

 

Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 5:37 pm
Views: 158
Rating: 1

Yo estoy haciendo un robot y llegué al tema de reconocimiento desde ahí. Si te fijas en la gramática que tengo implementada, va orientado a ordenes para un robot...

Haz la lista de frases que querrías reconocer y buscamos como integrarlas o si se pueden integrar con lo que hay.

 

Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 6:23 pm
Views: 87
Rating: 8

please dime si vez mi archivo de sesion, la pagina me indica que termino pero no lo veo en la lista, tal vez es un tema de actualizacion...lo subi como un attachment en:

http://www.voxforge.org/home/audacity

 

saludos

 

Mauricio

Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 6:31 pm
Views: 49
Rating: 1

Hola de nuevo...

ufff creo tenemos que hablar mas de lo que estamos haciendo, soy el encargado del proyecto monobotics, mira en:

http://monobotics.sourceforge.net

mi idea final es poder integrar tambien algun reconocimiento de voz basico para manejo de robots y entornos de automatizacion en el proyecto que tengo (un estudio/framework de robotica y automatizacion)..

cual de todos los archivos que tienes se refiere especificamente a tu gramatica y los comandos para robots a los que te refieres?

en mi caso me gustaria ademas de eso agregar algunos basicos para manejo de mouse/teclado y manipulacion de escenarios de edicion 3D como: "insertar caja"...

 

Mauricio

Re: New training phrases for spanish
User: kmaclean
Date: 11/18/2008 8:14 pm
Views: 257
Rating: 9

Hi Ivan,

>Could this noise afect to the training process?

Yes.

If you don't mark it as noise in your transcription (i.e. prompt line), your acoustic models might expect certain words to contain a click sound in them... and thus decrease your recognition accuracy.

>"chick" noise at the beginning of his phrases [...]

>Could it be removed in some easy way

Two approaches to address this:

  1. Create a "click' word/phoneme entry in your pronunciation dictionary (CLICK [CLICK] cl) , and include it in your transcription (i.e. prompt001 CLICK THE HOUSE WAS FORECLOSED).  The HTK training process will take care of the rest. 
  2. (recommended approach) Remove the "click" noise with an audio editing program like SOX (the swiss army knife of audio editing...), using the "trim" parameter:

trim start [length]

Trim can trim off unwanted audio from the beginning and end of the audio. Audio is not sent to the output stream until the start location is reached.

Ken

Re: New training phrases for spanish
User: buhochileno
Date: 11/23/2008 2:46 pm
Views: 105
Rating: 1

Hi ubanov:

I remove all the "chick" sound in the phrases (I remove it manually I'm trying to make a script to trim first and last second on each file) and I'm trying to upload the file, hopefully this time is going to work..

I attach a "wish list" of word that I would like to be able to recognize, is a long list and of course I want to help in anithing related, like the necesary phrases, etc..so just let me know what program from yuo and in with order can I use to make a gramar, determine what phonemas are missing, etc...

Cheers,

By the way, let me know if you want some help with the robot, I have lot of experience building Pc based linux robots..I add some media content in the http://monobotics.sourceforge.net site to see what we do about it..

P.S: Ken: do I need some special permision to be able to add a attach of about 80mb on the http://www.voxforge.org/home/submitspeech/linux/step-3/upload  ?

bye..

 

spanish.dict spanish.dict
PreviousNext