A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados

AUTOR(ES)
DATA DE PUBLICAÇÃO

2007

RESUMO

As técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs) podem ser consideradas como uma forma de representação do conhecimento baseada no raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o relacionamento entre as variáveis de um determinado conjunto de dados, mas como este é um problema NP-completo o espaço de busca se torna muito amplo na maioria das aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC (Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos através de experimentos realizados com 10 conjuntos de dados mostram que o MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)

ASSUNTO(S)

data mining (mineração de dados) aprendizado de computador redes bayesianas ciencia da computacao

Documentos Relacionados