Natural_Language_Processing_Document_Parser

Installation

In terminal run:

pip install -r requirements.txt

In terminal run

python3 AutoDocSum.py

then, follow prompt to enter path to .pdf file

The PDF form fields will be printed into groups by similarity calculated by Latent Dirichlet Allocation (LDA).

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
pdf_articles		pdf_articles
AutoDocSum.py		AutoDocSum.py
Example_Insurance_Claim.pdf		Example_Insurance_Claim.pdf
README.md		README.md
autodocsum_gui.py		autodocsum_gui.py
figure_results.png		figure_results.png
gitit.sh		gitit.sh
lda_gui.py		lda_gui.py
requirements.txt		requirements.txt
results.txt		results.txt