Redução da dimensionalidade em bases de dados de expressão gênica

AUTOR(ES)
DATA DE PUBLICAÇÃO

2006

RESUMO

O rápido desenvolvimento das pesquisas na área de genoma e proteoma têm contribuído para o crescimento acelerado das bases de dados biológicas, inviabilizando a análise humana sem algum suporte tecnológico. Uma das características desses tipos de dados é que eles possuem um número grande de atributos (genes) e um número pequeno de amostras, o que compromete o desempenho do algoritmo de mineração de dados. A utilização de métodos de redução de dimensionalidade, tal como a seleção de atributos, permite, além da remoção de dados redundantes e irrelevantes, uma melhor compreensibilidade dos resultados gerados, identificando a influência de cada atributo selecionado e do seu nível de expressão de acordo com o objetivo desejado. Nesse trabalho é apresentado um estudo comparativo de métodos de redução de dimensionalidade aplicados em cinco bases de expressão gênica. Os métodos aplicados: são: a seleção de atributos e o método de projeção aleatória. Ambos os métodos serão usados como uma etapa de pré-processamento na Mineração de Dados. A seleção de atributos tem como objetivo descobrir um subconjunto de atributos relevantes para uma tarefa alvo, considerando os atributos originais, e é importante, entre outras coisas, por tornar o processo de aprendizagem mais eficiente. A seleção de atributos é um método de redução de dimensionalidade que obtém resultados promissores quando aplicado em bases de expressão gênica. O método de projeção aleatória é um método alternativo, pois, além de diminuir o custo computacional quando aplicado, principalmente em conjunto com a seleção de atributos, produz resultados significativos. Os resultados dos experimentos mostram que a aplicação desses métodos de redução de dimensionalidade produz uma taxa de acerto do classificador maior do que quando aplicado somente o algoritmo de mineração sobre as bases de dados com todos os atributos.

ASSUNTO(S)

exploração de dados ciencia da computacao biologia computacional informática

Documentos Relacionados