Skip to content

Latest commit

 

History

History
47 lines (36 loc) · 1.39 KB

README.md

File metadata and controls

47 lines (36 loc) · 1.39 KB

GitHub code size in bytes GitHub top language GitHub pull requests GitHub tag (latest by date) GitHub contributors GitHub last commit

GitHub stars GitHub followers GitHub forks

aws-textract

Ferramenta que lê os arquivos PDFs, realiza OCR e salva em JSON.

Intruções

  1. Virtual env;
  2. Dependências;
  3. Configurações AWS;
  4. Executar script;

Virtual env

virtualenv -p python3 env
source env/bin/activate

Dependências

pip3 install -r requirements.txt

Configurações AWS

sudo apt install awscli -y
aws configure

Executar script

python main.py

Arquivo que foi utilizado de exemplo:

https://pt.wikipedia.org/wiki/Nota_fiscal_eletr%C3%B4nica