Um estudo sobre o método da mistura de gaussianas para formação de grupos de dados.

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

O presente texto discorre sobre o método da mistura de gaussianas aplicado à formação de agrupamentos (clusters) de observações a partir de um conjunto maior de dados. Trata-se de um problema sem solução analítica e, assim, utiliza-se o algoritmo EM (Expectation Maximization) para encontrar soluções por meio de dois procedimentos: inicializações aleatórias e pré-estimativas via métodos hierárquicos de formação de clusters. Conclui-se que a segunda opção é robusta quando se utiliza o método de Ward, enquanto que a primeira também propicia bons resultados, mas que são raros dentre muitas soluções ruins ou pontos de singularidade. Apresenta-se também um exemplo dos métodos estudados com dados reais de empresas brasileiras para ilustrar e complementar o trabalho.

ASSUNTO(S)

análise estatística pesquisa operacional processos gaussianos algoritmo esperança-maximização métodos estatísticos análise de aglomerados processos estocásticos

Documentos Relacionados