Build software better, together

deepdoctection / deepdoctection

A Repo For Document AI

python nlp ocr tensorflow pytorch document-parser document-layout-analysis table-recognition table-detection document-understanding publaynet layoutlm document-ai document-image-analysis pubtabnet

Updated Apr 10, 2025
Python

RapidAI / LabelConvert

Star

🔄 A tool for object detection and image segmentation dataset format conversion.

convert coco publaynet yolov5 labelimg-tool labelme-annotations yolox yolov6 yolov8

Updated Dec 11, 2024
Python

hpanwar08 / detectron2

Star

Detectron2 for Document Layout Analysis

python computer-vision deep-learning pytorch neural-networks segmentation object-detection text-detection semantic-segmentation document-image-processing document-layout maskrcnn mask-rcnn dla document-layout-analysis detectron2 publaynet document-image-analysis

Updated Aug 2, 2024
Python

phamquiluan / PubLayNet

Star

ICDAR 2019: MaskRCNN on PubLayNet datasets. Paragraph detection, table detection, figure detection,...

pytorch object-detection pretrained-models mask-rcnn document-layout-analysis table-detection figure-detection publaynet paragraph-detection

Updated May 11, 2021
Python

Complex data extraction and orchestration framework designed for processing unstructured documents. It integrates AI-powered document pipelines (GenAI, LLM, VLLM) into your applications, supporting various tasks such as document cleanup, optical character recognition (OCR), classification, splitting, named entity recognition, and form processing

python docker ocr pytorch omr optical-character-recognition optical-mark-recognition icr document-parser document-layout-analysis table-recognition table-detection publaynet intelligent-character-recognition intelligent-word-recognition iwr pubtabnet

Updated Mar 31, 2025
Python

wix-incubator / DLT

Star

Diffusion Layout Transformer implementation.

layouts web-design magazine diffusion generative-models rico publaynet ddpm generative-ai iccv2023 discrete-diffusion continous-diffusion layout-generation

Updated Aug 29, 2023
Python

JPLeoRX / detectron2-publaynet

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

BobLd / PdfPigMLNetBlockClassifier

Sponsor

Star

Proof of concept of training a simple Region Classifier using PdfPig and ML.NET (LightGBM). The objective is to classify each text block in a pdf document page as either title, text, list, table and image.

classifier pdf machine-learning csharp lightgbm pdf-document document-layout layout-analysis pdf-document-processor document-layout-analysis ml-net pdfpig publaynet

Updated Mar 16, 2020
C#

CaseDrive / publaynet-models

Star

Trained Detectron2 object detection models for document layout analysis based on PubLayNet dataset

python machine-learning computer-vision deep-learning neural-network python3 pytorch artificial-intelligence neural-networks faster-rcnn document-classification object-detection document-analysis document-layout instance-segmentation layout-analysis document-layout-analysis detectron2 publaynet

Updated Apr 16, 2023
Python

BobLd / PublayNet-maskrcnn-mlnet

Sponsor

Star

Using a MaskRCNN model trained on the PublayNet dataset with ML.Net in C# / .Net for Document layout analysis and page segmmentation task.

ocr csharp dotnet pretrained-models mask-rcnn onnx document-layout-analysis mlnet table-detection figure-detection page-segmentation publaynet mask-detection paragraph-detection

Updated May 13, 2023
C#

BobLd / PdfPigSvmRegionClassifier

Sponsor

Star

Proof of concept of a simple SVM Region Classifier using PdfPig and Accord.Net. The objective is to classify each text block in a pdf document page as either title, text, list, table and image.