VoxForge
после того как начитывается текст.
Там же должна быть пофонемная разметка.
Автоматически делается или в ручную?
Какое разделение фонем используется? (всмысле какой набор фонем) .
Подходят ли аудио книги для этого?
Почему нет проекта не S2T а Phonetic Search ?
Много вопросов ? :)
> после того как начитывается текст.
Никак не делаются
> Там же должна быть пофонемная разметка.
Не должна
> Автоматически делается или вручную?
Если такая разметка нужна, её можно сделать автоматически.
> Какое разделение фонем используется? (всмысле какой набор фонем) .
Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.
> Подходят ли аудио книги для этого?
Для чего этого?
> Почему нет проекта не S2T а Phonetic Search ?
Почему люди не летают?
> Автоматически делается или вручную?
Если такая разметка нужна, её можно сделать автоматически.
================
разве разметка не нужна для обучения ??
> Какое разделение фонем используется? (всмысле какой набор фонем) .
Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.
====
круто
как имея текст получить последовательность аллофонов ?
> Подходят ли аудио книги для этого?
Для чего этого?
=======
у аудио книги есть текст + аудио
подходят ли они как моделии обучения? почему ?
> Почему нет проекта не S2T а Phonetic Search ?
Почему люди не летают?
====
те его нет почему ?
потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T
мне казалось там разница не очень большая ....
> разве разметка не нужна для обучения?
Разметка на аллофоны не нужна, только транскрипция уровня слов.
> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.
> подходят ли они как модели обучения? почему?
Для обучения модели аудиокниги используются. В данной
базе они больше 70% составляют.
> потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T. мне казалось там разница не очень большая ....
Разницы между распознаванием и поиском нет. Тем не менее, доступного ПО по индексации и поиску нет. На вопрос "почему" я затрудняюсь ответить.
> разве разметка не нужна для обучения?
Разметка на аллофоны не нужна, только транскрипция уровня слов.
====
где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?
> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.
===========
где можно помотреть алгоритмы ? Или нужно копаться в исходниках программ? Каких программ ? Для русского языка.
> подходят ли они как модели обучения? почему?
Для обучения модели аудиокниги используются. В данной
базе они больше 70% составляют.
========
Разметка уровня слов была сделана автоматически?
> потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T. мне казалось там разница не очень большая ....
Разницы между распознаванием и поиском нет. Тем не менее, доступного ПО по индексации и поиску нет. На вопрос "почему" я затрудняюсь ответить.
=====================
А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t ? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.
> где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?
Хм, алгоритмы для получения разметки уровня слов это алгоритмы распознавания речи. Посмотреть информацию о них можно в книжке. Spoken Language Processing например:
http://dsp-book.narod.ru/SLP1.djvu
http://dsp-book.narod.ru/SLP2.djvu
> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.
Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc
Реализацию этих алгоритмов можно найти в синтезаторе русской речи.
> Разметка уровня слов была сделана автоматически?
Для тренировки базы разметка делается вручную.
> А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.
Большой надобности нет.
> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.
Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc
Реализацию этих алгоритмов можно найти в синтезаторе русской речи.
========
Спасибо за doc.
Можно название или сылку на синтезатор.
> Разметка уровня слов была сделана автоматически?
Для тренировки базы разметка делается вручную.
=============
МММ. Какая то путаница.
Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) . И это операция сейчас не делается автоматически.Те это ручная операция и если она будет автоматизированна то распознование может быть улучшенно, за счёт большей базы?
Это верно как для русского так и для английского языков ?
Тогда я не понял про то что вы говорили про автоматическую разметку. И почему она не годится для тренировки.
С какой точностью нужна разметка по словам ? сотые секунд , тысячные?
Нужны ли ещё базы для улучшения качества ?
Нужны ли допустим размеченные аудио книги. Или для улучшения базы нужны другие источники аудио данных(телевидение , радио ....).
Те те записи которые люди записывают через зайт (java аплет ) он потом вручную размечается ?
> Можно название или сылку на синтезатор.
Festival/msu_ru_nsh_clunits
http://festlang.berlios.de/docu/doku.php?id=russianru
> Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) .
Нет. То, как выглядит база можно посмотреть, скачав её на этом сайте. База состоит из большого числа коротких записей (5-10с) и текста к каждой из записей.
> Нужны ли ещё базы для улучшения качества ?
Единственная цель этого ресурса - собрать дополнительные базы для улучшения качества.
после того как начитывается текст.
Там же должна быть пофонемная разметка.
Автоматически делается или в ручную?
Какое разделение фонем используется? (всмысле какой набор фонем) .
Подходят ли аудио книги для этого?
Почему нет проекта не S2T а Phonetic Search ?
Много вопросов ? :)
после того как начитывается текст.
Там же должна быть пофонемная разметка.
Автоматически делается или в ручную?
Какое разделение фонем используется? (всмысле какой набор фонем) .
Подходят ли аудио книги для этого?
Почему нет проекта не S2T а Phonetic Search ?
Много вопросов ? :)