Algoritmos e arquiteturas para processamento de documentos digitalizados monocromÃticos

AUTOR(ES)
DATA DE PUBLICAÇÃO

2006

RESUMO

Em projetos de digitalizaÃÃo de alto volume de documentos, a imagem dos documentos digitalizados pode ser gerada com vÃrios defeitos acarretando dificuldades desde a sua leitura atà sua transcriÃÃo automÃtica. AlÃm disso, o alto volume de documentos a serem processados gera a necessidade de automatizaÃÃo do processo de digitalizaÃÃo e à procura por melhores soluÃÃes para esses problemas. Esta dissertaÃÃo aborda os seguintes problemas encontrados nos documentos digitalizados monocromÃticos: detecÃÃo e remoÃÃo de borda preta e; detecÃÃo e correÃÃo da orientaÃÃo e enviesamento. Um novo filtro para remoÃÃo de borda preta foi desenvolvido, testado em 21 mil documentos e comparado com vÃrias ferramentas comerciais. Um novo algoritmo de detecÃÃo de orientaÃÃo e enviesamento com capacidade de estimar a rotaÃÃo em qualquer Ãngulo com uma precisÃo de 0,1 foi desenvolvido e comparado com outro mÃtodo da literatura. Um segundo algoritmo de detecÃÃo de enviesamento foi proposto com o objetivo de aumentar o desempenho do processamento. Observaram-se trÃs problemas na correÃÃo de rotaÃÃo do algoritmo clÃssico: pontos brancos, contorno acidentado e desconexÃo de parte dos objetos. Um algoritmo de correÃÃo de rotaÃÃo foi proposto com capacidade de corrigir os trÃs problemas. Um mÃtodo quantitativo para medir a degradaÃÃo dos algoritmos de correÃÃo de rotaÃÃo foi introduzido e utilizado para comparar o novo algoritmo com outros da literatura. AlÃm dos filtros, duas arquiteturas para processamento de documentos digitalizados monocromÃticos foram estudadas: seqÃencial e cluster. Um ambiente visual, intitulado BigBatch, foi construÃdo com ambas as arquiteturas. A arquitetura em grid foi apenas especulada

ASSUNTO(S)

document processing engenharia eletrica detecÃÃo e correÃÃo de orientaÃÃo e enviesamento documentos digitalizados monocromÃticos black border removal image processing processamento de imagens monochromatic document image skew and orientation detection and correction remoÃÃo de borda preta processamento de documentos

Documentos Relacionados