Seleção de variáveis para classificação de bateladas produtivas com base em múltiplos critérios
AUTOR(ES)
Anzanello, Michel José
FONTE
Prod.
DATA DE PUBLICAÇÃO
01/02/2013
RESUMO
Processos industriais são frequentemente descritos por um elevado número de variáveis correlacionadas e ruidosas. Este artigo apresenta um método para seleção das variáveis mais relevantes para classificação de bateladas de produção valendo-se de múltiplos critérios de desempenho (sensibilidade e especificidade). As bateladas são categorizadas em duas classes (conforme ou não conforme, por exemplo). O método utiliza a regressão PLS (Partial Least Squares) para derivar um índice de importância das variáveis de processo. Um procedimento iterativo de classificação das bateladas e eliminação das variáveis é então conduzido. Por fim, uma medida de distância euclidiana ponderada é aplicada para selecionar o melhor subconjunto de variáveis. Ao ser aplicado em dados de processos industriais, o método proposto reteve, em média, 12% das variáveis originais, elevando a sensibilidade em 9%, de 0,78 para 0,85, e a especificidade em 20%, de 0,64 para 0,77. Estudos de simulação permitiram avaliar o desempenho do método frente a cenários distintos.
ASSUNTO(S)
seleção de variáveis múltiplos critérios regressão pls
Documentos Relacionados
- Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes
- Seleção de variáveis para clusterização de bateladas produtivas através de ACP e remapeamento kernel
- Novos critérios para seleção de modelos neurais em problemas de classificação com dados desbalanceados
- Um novo método para seleção de variáveis preditivas com base em índices de importância
- Árvore de decisão para classificação de ocorrências de ferrugem asiática em lavouras comerciais com base em variáveis meteorológicas