Bem vindo!
Voxforge foi criado para coletar transcrições de fala para uso com programas de reconhecimento de voz livres e baseados em código aberto.
Nós disponibilizaremos todos os arquivos de áudio submetidos sob a licença GPL e então iremos 'compilá-los' em modelos acústicos para uso com os softwares de reconhecimento de voz de código aberto, como o Sphinx, ISIP, Julius e HTK (nota: HTK possui restrições de distribuição).
Por que precisamos de gravações de voz Livres e GPL?
A maioria dos modelos acústicos usados pelos programas de reconhecimento de voz (ou fala-para-texto) "open source" são de "código fechado". Eles não dão a você acesso as amostras de áudio ou às transcrições (i.e. o "speech corpus") usados para criar o modelo acústico.
Devido a isto os projetos livres de código aberto são obrigados a comprar grandes "speech corpora" com licenças restritivas. Apesar de existirem alguns poucos exemplos de pequenos "speech corpora" livres e de código aberto que poderiam ser utilizados para criar modelos acústicos, a maioria dos "corpora" (especialmente os grandes corpora, mais adequados para a criação de bons modelos acústicos) devem ser comprados sob licenças restritivas.
Como você pode ajudar?
Grave sua voz lendo algum texto, então envie suas gravações para o VoxForge usando uma das seguintes formas:
- Seu computador (através de um applet Java que exibe uma lista de frases para serem lidas por você e um sistema de upload com único "click" do mouse; mirrors);
- Seu telefone (Profedores de serviço telefônico de longa distância gratuitos).
Outras Opções:
- Grave um capítulo de AudioLivro com o projeto LibriVox e então submeta-o ao VoxForge (em um formato de áudio não-compactado);


