Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
AUTOR(ES)
Crovato, César David Paredes
DATA DE PUBLICAÇÃO
2007
RESUMO
Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.
ASSUNTO(S)
redes neurais artificiais voz disfônica : transformadas wavelet voz : patologia : análise acústica
ACESSO AO ARTIGO
http://hdl.handle.net/10183/6465Documentos Relacionados
- Aplicação da transformada Wavelet Packet na análise e classificação de sinais de vozes patológicas
- Detecção e classificação de faltas a partir da análise de registros oscilográficos via redes neurais artificiais e transformada wavelet
- Transformada Wavelet Packet
- OUTFLOW FORECAST BASED ON ARTIFICIAL NEURAL NETORKS AND WAVELET TRANSFORM
- Classificação de estratos florestais utilizando redes neurais artificiais e dados de sensoriamento remoto