Engenhos de busca distribuÃdos: uma abordagem visando escalabilidade para Crawling e IndexaÃÃo
AUTOR(ES)
Marcelo RÃmulo Fernandes
DATA DE PUBLICAÇÃO
2001
RESUMO
A Internet à uma das principais fontes de informaÃÃo utilizadas no apoio à soluÃÃo de problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos meios mais utilizados para pesquisa de informaÃÃo nesse ambiente. Observa-se que o tamanho extraordinÃrio, o crescimento exponencial e a elevada taxa de modificaÃÃo da âWorld-Wide-Webâ (www) requerem novas abordagens aos problemas de indexaÃÃo e pesquisa de informaÃÃo na estrutura dos Engenhos de Busca. Neste trabalho, uma soluÃÃo distribuÃda para operaÃÃo de Engenhos de Busca à apresentada, visando escalabilidade e atualidade. SÃo comentadas arquiteturas distribuÃdas para Engenhos de Busca. Apresenta-se o Radix, um Engenho de Busca distribuÃdo para indexar e pesquisar informaÃÃo na www, baseado em visÃes Web. Um protÃtipo à desenvolvido, focalizando a implementaÃÃo de crawling e indexaÃÃo do Radix distribuÃdo, a fim de validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre Engenhos de Busca centralizados e distribuÃdos à apresentado, encorajando o uso de tÃcnicas de distribuiÃÃo para elevar os valores de cobertura e atualidade desses sistemas
ASSUNTO(S)
engenho de busca crawling e indexaÃÃo agents visÃo web search engine crawling escalabilidade indexing scalability webviews ciencia da computacao distributed systems sistemas distribuÃdos
Documentos Relacionados
- Arquitetura de softwares e estilos arquiteturais distribuÃdos: especificaÃÃo, validaÃÃo, anÃlise e implementaÃÃo
- Barramento de serviÃos federados para integraÃÃo federativa de sistemas distribuÃdos
- JEDPI: um ambiente para executar programas distribuÃdos na Internet.
- Um ambiente para geraÃÃo automÃtica de biblioteca de componentes de comunicaÃÃo em sistemas embarcados distribuÃdos
- Um modelo hÃbrido e adaptativo para sistemas distribuÃdos tolerantes a falhas