Algoritmos e arquiteturas para processamento de documentos digitalizados monocromÃticos
AUTOR(ES)
Bruno TenÃrio Ãvila
DATA DE PUBLICAÇÃO
2006
RESUMO
Em projetos de digitalizaÃÃo de alto volume de documentos, a imagem dos documentos digitalizados pode ser gerada com vÃrios defeitos acarretando dificuldades desde a sua leitura atà sua transcriÃÃo automÃtica. AlÃm disso, o alto volume de documentos a serem processados gera a necessidade de automatizaÃÃo do processo de digitalizaÃÃo e à procura por melhores soluÃÃes para esses problemas. Esta dissertaÃÃo aborda os seguintes problemas encontrados nos documentos digitalizados monocromÃticos: detecÃÃo e remoÃÃo de borda preta e; detecÃÃo e correÃÃo da orientaÃÃo e enviesamento. Um novo filtro para remoÃÃo de borda preta foi desenvolvido, testado em 21 mil documentos e comparado com vÃrias ferramentas comerciais. Um novo algoritmo de detecÃÃo de orientaÃÃo e enviesamento com capacidade de estimar a rotaÃÃo em qualquer Ãngulo com uma precisÃo de 0,1 foi desenvolvido e comparado com outro mÃtodo da literatura. Um segundo algoritmo de detecÃÃo de enviesamento foi proposto com o objetivo de aumentar o desempenho do processamento. Observaram-se trÃs problemas na correÃÃo de rotaÃÃo do algoritmo clÃssico: pontos brancos, contorno acidentado e desconexÃo de parte dos objetos. Um algoritmo de correÃÃo de rotaÃÃo foi proposto com capacidade de corrigir os trÃs problemas. Um mÃtodo quantitativo para medir a degradaÃÃo dos algoritmos de correÃÃo de rotaÃÃo foi introduzido e utilizado para comparar o novo algoritmo com outros da literatura. AlÃm dos filtros, duas arquiteturas para processamento de documentos digitalizados monocromÃticos foram estudadas: seqÃencial e cluster. Um ambiente visual, intitulado BigBatch, foi construÃdo com ambas as arquiteturas. A arquitetura em grid foi apenas especulada
ASSUNTO(S)
document processing engenharia eletrica detecÃÃo e correÃÃo de orientaÃÃo e enviesamento documentos digitalizados monocromÃticos black border removal image processing processamento de imagens monochromatic document image skew and orientation detection and correction remoÃÃo de borda preta processamento de documentos
Documentos Relacionados
- Emprego dos princípios Linked Data para gestão semântica de documentos digitalizados
- Arquiteturas e algoritmos para um analisador de interconexões
- Algoritmos para alocação de recursos em arquiteturas reconfiguraveis
- IMAGE PROCESSING AND COMPUTER VISION ALGORITHMS FOR GRAPHICS CARDS PARALLEL ARCHITECTURES
- Implementação e simulação de algoritmos de escalonamento para sistemas de elevadores usando arquiteturas reconfiguráveis.