Redução da dimensionalidade em bases de dados de expressão gênica
AUTOR(ES)
Helyane Bronoski Borges
DATA DE PUBLICAÇÃO
2006
RESUMO
O rápido desenvolvimento das pesquisas na área de genoma e proteoma têm contribuído para o crescimento acelerado das bases de dados biológicas, inviabilizando a análise humana sem algum suporte tecnológico. Uma das características desses tipos de dados é que eles possuem um número grande de atributos (genes) e um número pequeno de amostras, o que compromete o desempenho do algoritmo de mineração de dados. A utilização de métodos de redução de dimensionalidade, tal como a seleção de atributos, permite, além da remoção de dados redundantes e irrelevantes, uma melhor compreensibilidade dos resultados gerados, identificando a influência de cada atributo selecionado e do seu nível de expressão de acordo com o objetivo desejado. Nesse trabalho é apresentado um estudo comparativo de métodos de redução de dimensionalidade aplicados em cinco bases de expressão gênica. Os métodos aplicados: são: a seleção de atributos e o método de projeção aleatória. Ambos os métodos serão usados como uma etapa de pré-processamento na Mineração de Dados. A seleção de atributos tem como objetivo descobrir um subconjunto de atributos relevantes para uma tarefa alvo, considerando os atributos originais, e é importante, entre outras coisas, por tornar o processo de aprendizagem mais eficiente. A seleção de atributos é um método de redução de dimensionalidade que obtém resultados promissores quando aplicado em bases de expressão gênica. O método de projeção aleatória é um método alternativo, pois, além de diminuir o custo computacional quando aplicado, principalmente em conjunto com a seleção de atributos, produz resultados significativos. Os resultados dos experimentos mostram que a aplicação desses métodos de redução de dimensionalidade produz uma taxa de acerto do classificador maior do que quando aplicado somente o algoritmo de mineração sobre as bases de dados com todos os atributos.
ASSUNTO(S)
exploração de dados ciencia da computacao biologia computacional informática
Documentos Relacionados
- "Análise visual em processos de redução de dimensionalidade para mineração em sistemas de bases de dados"
- Investigação sobre métodos para redução de dimensionalidade dos dados em imagens hiperespectrais
- Aplicação da análise de agrupamento de dados de expressão gênica temporal a dados em painel
- Comitês de grupamento aplicados a dados de expressão gênica
- Métodos de agrupamento na análise de dados de expressão gênica