2002-08

Avaliação de diferentes estratégias de blocagem no relacionamento probabilístico de registros

A blocagem (blocking), que consiste na criação de blocos lógicos de registros dentro de arquivos a serem relacionados, é um dos processos que faz parte do relacionamento probabilístico de grandes bases de dados. Os objetivos deste trabalho são comparar a eficiência de diferentes esquemas de blocagem e estudar a eficiência da utilização de uma rotina de padronização desenvolvida pelos autores, que aplica a mesma grafia para as primeiras sílabas de nomes com o mesmo som. Procedemos ao relacionamento de uma base de dados de mortalidade com 59.065 óbitos com uma base de óbitos hospi...

Texto completo
  • Assuntos:

    • Banco de dados
    • Relacionamento probabilístico de registros
    • Blocagem
    • Epidemiologia