Engenhos de busca distribuÃdos: uma abordagem visando escalabilidade para Crawling e IndexaÃÃo

AUTOR(ES)
DATA DE PUBLICAÇÃO

2001

RESUMO

A Internet à uma das principais fontes de informaÃÃo utilizadas no apoio à soluÃÃo de problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos meios mais utilizados para pesquisa de informaÃÃo nesse ambiente. Observa-se que o tamanho extraordinÃrio, o crescimento exponencial e a elevada taxa de modificaÃÃo da âWorld-Wide-Webâ (www) requerem novas abordagens aos problemas de indexaÃÃo e pesquisa de informaÃÃo na estrutura dos Engenhos de Busca. Neste trabalho, uma soluÃÃo distribuÃda para operaÃÃo de Engenhos de Busca à apresentada, visando escalabilidade e atualidade. SÃo comentadas arquiteturas distribuÃdas para Engenhos de Busca. Apresenta-se o Radix, um Engenho de Busca distribuÃdo para indexar e pesquisar informaÃÃo na www, baseado em visÃes Web. Um protÃtipo à desenvolvido, focalizando a implementaÃÃo de crawling e indexaÃÃo do Radix distribuÃdo, a fim de validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre Engenhos de Busca centralizados e distribuÃdos à apresentado, encorajando o uso de tÃcnicas de distribuiÃÃo para elevar os valores de cobertura e atualidade desses sistemas

ASSUNTO(S)

engenho de busca crawling e indexaÃÃo agents visÃo web search engine crawling escalabilidade indexing scalability webviews ciencia da computacao distributed systems sistemas distribuÃdos

Documentos Relacionados