VoxForge
К сожалению, качество распознавания оставляет желать лучшего. :-( Каждый раз просить человека, что то записать и выслать Вам, практически не реально. Они просто делать этого не будут... Лень... :-( Слишком сложно! Простому пользователю это не объяснишь...
Поэтому резонный вопрос, а есть ли алгоритм или программа, способная автоматизировать процесс улучшения качества распознавания в sphinx4.
Например, некая программа устанавливается на Internet сервер, человек заходит туда, надиктовывает, что требуется и далее система sphinx4 сама дообучается и качественно распознает его голос? От человека требуется только зайти и произнести, некоторые слова. И не более!!! Это хоть и не многие, но думаю в состоянии сделать... По степенно, база и наберется.
Если программы нет. Может есть какое то описание, алгоритма как, такую программу можно написать? Входные, выходные форматы?
Буду рад услышать Ваши предложения и замечания по данному вопросу!
> Поэтому резонный вопрос, а есть ли алгоритм или программа, способная автоматизировать процесс улучшения качества распознавания в sphinx4.
Есть такая программа:
http://www.dev.voxforge.org/projects/Main/browser/Trunk/SpeechSubmission/VFSpeechSubmission
Попробовать эту программу можно здесь:
http://www.voxforge.org/ru/read
> Может есть какое то описание, алгоритма как, такую программу можно написать? Входные, выходные форматы?
Описание алгоритма тоже есть
Спасибо за ответ.
1. Как можно исходники, этой программы скачать одним файлом? Я java код понимаю лучше чем английский язык... :-(
2. Можно ли список вопросов, который входит в программу менять? Для улучшения распознавания некоторых слов или фраз.
3. Как полученный результат интегрировать в sphinx4 на лету?
> Как можно исходники, этой программы скачать одним файлом? Я java код понимаю лучше чем английский язык... :-(
svn checkout http://www.dev.voxforge.org/svn/Main/Trunk/SpeechSubmission/VFSpeechSubmission
> Можно ли список вопросов, который входит в программу менять? Для улучшения распознавания некоторых слов или фраз.
Можно
> Как полученный результат интегрировать в sphinx4 на лету?
Скопировать файлы?
Апплет конечно на Java, но сервеная часть на php... :-(
1. Есть ли вариант с java servlet или jsp?
2. А что в конечном итоге она в файловую систему записывает? Просто wav файлы, с определенными именами? Можно ссылку на пример архива, что она на сервере формирует?
3. Как эти файлы в sphinx4 импортировать?
> Есть ли вариант с java servlet или jsp?
Нет
> А что в конечном итоге она в файловую систему записывает? Просто wav файлы, с определенными именами? Можно ссылку на пример архива, что она на сервере формирует?
http://www.voxforge.org/home/listen
> Как эти файлы в sphinx4 импортировать?
http://www.speech.cs.cmu.edu/sphinx/tutorial.html
Если я правильно понял tutorial, то программы, которая автоматически дообучала бы sphinx4 по созданному апплетом архиву нет?
И судя по tutorial Все делается ручками? :-(
Не получил ответа на предыдущее сообщение?
Поясню ситуацию. По задаче, которая передо мной стоит, распознавать надо разные голоса в основном ранее не известные ранее системе.
Качество распознавания, у Вас хромает. Поэтому единственным решением, мне кажется, дообучать новым голосам на лету прямо on-line. Благо дело пользователи на это пойти могут.
Если для этого требуется человек, который ручками будет что то делать, то ничего не получится... :-( Если есть программа или ее можно написать, то можно попробовать.
Так есть программа обеспечивающая полный цикл или алгоритм (не инструкция с общими понятиями)? Программы, которая просто запишет звуковой файл мало...