A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
AUTOR(ES)
Sebastian David Carvalho de Oliveira Galvão
DATA DE PUBLICAÇÃO
2007
RESUMO
As técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs) podem ser consideradas como uma forma de representação do conhecimento baseada no raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o relacionamento entre as variáveis de um determinado conjunto de dados, mas como este é um problema NP-completo o espaço de busca se torna muito amplo na maioria das aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC (Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos através de experimentos realizados com 10 conjuntos de dados mostram que o MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)
ASSUNTO(S)
data mining (mineração de dados) aprendizado de computador redes bayesianas ciencia da computacao
ACESSO AO ARTIGO
http://www.bdtd.ufscar.br/htdocs/tedeSimplificado//tde_busca/arquivo.php?codArquivo=1824Documentos Relacionados
- Aprendizado supervisionado incremental de Redes Bayesianas para mineração de dados.
- Mineração de dados utilizando aprendizado não-supervisionado: um estudo de caso para bancos de dados da saúde
- Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
- Aprendizado supervisionado com conjuntos de dados desbalanceados
- Aprendizado supervisionado usando redes neurais construtivas.