Estudo da influÃncia de diversas medidas de similaridade na previsÃo de sÃries temporais utilizando o algoritmo KNN-TSP / Study of the influence of similarity measures in Time Series Prediction with the kNN-TSP algorithm

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

11/04/2012

RESUMO

SÃries temporais podem ser entendidas como qualquer conjunto de observaÃÃes que se encontram ordenadas no tempo. Dentre as vÃrias tarefas possÃveis com dados temporais, uma que tem atraÃdo crescente interesse, devido a suas vÃrias aplicaÃÃes, à a previsÃo de sÃries temporais. O algoritmo k-Nearest Neighbor - Time Series Prediction (kNN-TSP) à um mÃtodo nÃo-paramÃtrico de previsÃo de sÃries temporais que apresenta como uma de suas vantagens a facilidade de aplicaÃÃo, quando comparado aos mÃtodos paramÃtricos. Apesar da maior facilidade na determinaÃÃo de seus parÃmetros, algumas questÃes relacionadas continuam em aberto. Este trabalho està focado no estudo de um desses parÃmetros: a medida de similaridade. Esse parÃmetro foi avaliado empiricamente utilizando diversas medidas de similaridade em um grande conjunto de sÃries temporais que incluem sÃries artificiais, com caracterÃsticas sazonais e caÃticas, e vÃrias sÃries reais. Foi realizado tambÃm um estudo de caso comparativo entre a precisÃo da previsÃo do algoritmo kNN-TSP e a dos mÃtodos de MÃdias MÃveis (MA), Auto-regressivos de MÃdias MÃveis Integrados Sazonais (SARIMA) univariado e SARIMA multivariado, em uma sÃrie de fluxo diÃrio de pacientes na Ãrea de EmergÃncia de um hospital coreano. Neste trabalho à ainda proposta uma abordagem para o desenvolvimento de uma medida de similaridade hÃbrida, que combine caracterÃsticas de vÃrias medidas. Os resultados obtidos neste trabalho demonstram que as medidas da Norma Lp apresentam vantagem sobre as demais medidas avaliadas, devido ao seu menor custo computacional e por apresentar, em geral, maior precisÃo na previsÃo de dados temporais utilizando o algoritmo kNN-TSP. Apesar de na literatura, em geral, a medida Euclidiana ser adotada como medida de similaridade, a medida Manhattan pode ser considerada candidata interessante para definir a similaridade entre sÃries temporais, devido a nÃo apresentar diferenÃa estatisticamente significativa com a medida Euclidiana e possuir menor custo computacional. A medida proposta neste trabalho, nÃo apresenta resultados significantes, mas apresenta-se promissora para novas pesquisas. Com relaÃÃo ao estudo de caso, o algoritmo kNN-TSP, com apenas o parÃmetro de medida de similaridade otimizado, alcanÃa um erro consideravelmente inferior a melhor configuraÃÃo com MA, e pouco maior que as melhores configuraÃÃes dos mÃtodos SARIMA univariado e SARIMA multivariado, sendo essa diferenÃa inferior a um por cento.

ASSUNTO(S)

sistemas dinamicos sÃries temporais previsÃo k-nearest neighbor - time series prediction time series forecasting k-nearest neighbor - time series prediction, k-nearest neighbor k-nearest neighbor

Documentos Relacionados