OCR -InRe

OCR-InRe: Um detector e extrator de textos de imagens de faturas

  • 20000 Raised
  • 2 Juries

Categories

  • Inteligência Artificial

Featured Video

Description

Título: OCR-InRe: OCR Invoice Reader


Autores: Ailton José Rodrigues; Josenildo Vicente de Araújo.


Resumo: O uso de um sistema OCR para a gestão de faturas trás alguns benefícios tais como segurança, agilidade e eficiência na tomada de decisão, além de propiciar a empresa se tornar ambientalmente mais responsável evitando assim a impressão de faturas. O sistema OCR-InRe é uma API e aplicação Web que recebe como entrada imagens de faturas - em diversos formatos e configurações- e extrai as informações úteis para a empresa. A acurácia do sistema OCR-InRe é comparada a acurácia dos melhores sistemas existentes na literatura e no mercado superando o limiar existente de 98%.  


Palavras-chave: OCR; OCR-InRe; Python; faturas


Introdução: 

    O reconhecimento óptico de caracteres (OCR, sigla em inglês de Optical Character Recognition) é uma tecnologia que extrai texto de imagens. Sendo assim, através do OCR é possível obter um arquivo de texto editável por um computador. Normalmente, um sistema OCR inclui dois principais módulos: um módulo de detecção de texto e um módulo de reconhecimento de texto. 

    O uso de um sistema OCR para gestão de faturas justifica-se pela segurança, pois a empresa reduzirá os riscos de perder ou extraviar suas faturas impressas; pela facilidade de atualização e compartilhamento das informações, pois podem estar armazenadas na nuvem ou outro meio digital, tudo isso favorece as tomadas de decisão já que se tornam mais eficientes e a organização pode ainda dizer que se tornou ambientalmente mais responsável, visto que a digitalização de dados permitirá a redução de uso de papel e de impressões. 

    Nessa linha o sistema OCR-InRe tem como objetivo extrair textos de diferentes formatos de faturas garantindo uma acurácia (acima de 98%) e um tempo de processamento menor, superando os melhores sistemas existentes na literatura e no mercado.

     

Metodologia: 

    O sistema OCR-InRe é uma API com aplicação Web, feita a partir do framework Flask [2], em que receberá como entrada a imagem da fatura e como retorno as informações- úteis para a tomada de decisão- na forma de texto. A aplicação será toda desenvolvida na linguagem de programação Python [6], dividindo-se em três partes, sendo elas o pré-processamento, extração e tratamento. Na etapa de pré-processamento temos uma imagem como entrada da aplicação e serão feitas alguns tratamentos na imagem, melhorando o enquadramento, rotacionando e removendo fronteiras, melhorando a visibilidade do texto com a binarização e remoção de ruídos, sendo realizado com o apoio da biblioteca de visão computacional OpenCV [1].

    Na extração é feito o reconhecimento óptico do texto com a ferramenta Pytesseract [3]. Dessa forma, com a imagem já tratada será possível extrair com maior precisão os textos das imagens. Já no tratamento, os textos extraídos na etapa anterior serão separados, identificados e catalogados para serem apresentados como resultado do processo de extração. Para isso, o uso das bibliotecas Numpy [4] e Pandas [5] é necessário. A figura a seguir mostra o workflow do sistema OCR-InRe.



 Figura 1 - Fluxo do sistema OCR-InRe

Fonte: autoria dos autores (2021)

 

Referências:


[1] OPENCV. Disponível em: <https://opencv.org//> . Acesso em: 01 de out. de 2021.

[2] FLASK. Disponível em: <https://flask.palletsprojects.com/en/2.0.x/> .Acesso em: 01 de out. de 2021.

[3] PYTESSERACT. Disponível em:<https://pypi.org/project/pytesseract/> .Acesso em: 01 de out. de 2021.

[4] NUMPY. Disponível em:.<https://numpy.org/>. Acesso em: 01 de out. de 2021.

[5] PANDAS. Disponível em : <https://pandas.pydata.org/> Acesso em : 01 de out. de 2021

[6] PYTHON. Disponível em : <https://www.python.org/> Acesso em : 01 de out. de 2021





Copyright © 2022 All rights reserved. TAIKAI — Hackathon Platform.