Normalização de locutor em sistema de reconhecimento de fala

AUTOR(ES)
DATA DE PUBLICAÇÃO

2000

RESUMO

Este trabalho tem por objetivo avaliar um sistema de reconhecimento de fala de vocabulário flexível, quando utilizada a técnica de normalização de locutor. A técnica de normalização adotada foi a de escalonamento (“warping”) do eixo de freqüências. Este escalonamento foi realizado pela variação do banco de filtros, na escala Mel, na obtenção dos coeficientes Mel Cepstrais. Estes coeficientes e suas derivadas foram empregados nos Modelos Ocultos de Markov (HMMs) que modelam as sub-unidades da fala (fones). O banco de filtros foi então ajustado na tentativa de normalizar o comprimento do trato vocal dos diferentes locutores, sendo empregado um procedimento iterativo no retreinamento do sistema de reconhecimento. Na avaliação desta técnica, procuramos a melhor forma de realizar a normalização do sistema. Com a utilização deste método conseguiu-se reduzir a taxa de erro de um sistema básico, operando com um vocabulário de 400 palavras, de 19,25% para 11,25%.

ASSUNTO(S)

markov filtros adaptativos reconhecimento automatico da voz processos de espectro de frequencia

Documentos Relacionados