Skip to content

Latest commit

 

History

History
809 lines (524 loc) · 21 KB

File metadata and controls

809 lines (524 loc) · 21 KB

Tensorflow-Keras Real-time Object Detection

All about Tensorflow/Keras Object Detection

Tensorflow/Keras를 활용한 Object detection repository Hits





Python


다양한 환경에서 실시간 객체 검출을 위한 tensorflow-keras 오픈 소스 레포지토리입니다.
MobileNet-ssd, EfficientNet-ssd와 같이 Single Shot multibox Detector 기반의 객체 검출 모델을 제공합니다.
PASCAL VOC, COCO와 같은 벤치마크 데이터셋을 기본 제공하며, 사용자 설정에 따라 custom dataaset을 사용할 수 있습니다.
학습된 모델을 다양한 프레임워크 및 환경에서 추론할 수 있도록 export 기능을 제공합니다.

레포지토리 개선에 기여할 수 있도록 Pull-request 및 issue를 남겨주세요.

저자 이메일 : chansoo0710@gmail.com





Features

  • Dataset
    • PASCAL VOC 07+12
    • COCO2017
    • Custom dataset
  • Train
  • Evaluate
  • Predict
    • Image
    • Video
    • Webcam
  • Export
    • TensorRT
    • ONNX
    • Tensorflow-lite
    • Tensorflow-js
  • Tensorflow docker serving

Use library:

  • Tensorflow
  • Tensorflow-js
  • Tensorflow-lite
  • Tensorflow-datasets
  • Tensorflow-addons
  • Tensorflow-serving
  • Keras
  • OpenCV python

Options: Distribute training, Custom Data

Models: Single shot multibox detector (SSD), MobileNet-Series(1,2,3,3+), EfficientNet-Series(V1,V2,Lite)



Table of Contents

5. Eval

8. Demo



1. Models

현재 지원하는 모델 종류입니다.


Model Params Resolution(HxW) Inference time(ms) Pretrained weights Pretrained datasets mAP
EfficientNet-Lite-B0 3.01m 300x300 0.019ms Link PASCAL VOC 73.0%
EfficientNet-Lite-B0 3.01m 300x300 0.019ms Link Human detection -

Loss

Loss

Implementation

Cross entropy loss OK
Focal cross entropy loss OK
Hard negative mining OK
Smooth L1 OK
GIoU OK


2. Dependencies

본 레포지토리의 종속성은 다음과 같습니다.

OS Ubuntu 18.04
TF version 2.9.1
Python version 3.8.13
CUDA 11.1
CUDNN cuDNN v8.1.0 , for CUDA 11.1


학습 및 평가를 위해 Anaconda(miniconda) 가상환경에서 패키지를 다운로드 합니다.

conda create -n envs_name python=3.8

pip install -r requirements.txt


3. Preparing datasets

프로그램에 필요한 DatasetTensorflow Datasets 라이브러리(TFDS)를 사용합니다.

TFDS Object detection dataset

  1. PASCAL VOC
  2. COCO2017

파일 다운로드 방법은 다음과 같습니다.

# PASCAL VOC download
python download_datasets.py --train_dataset='voc'

# COCO2017 download
python download_datasets.py --train_dataset='coco'

Custom TFDS의 경우 TFDS 변환 방법을 참고해주세요.



4. Train

학습하기전 tf.data의 메모리 할당 문제로 인해 TCMalloc을 사용하여 메모리 누수를 방지합니다.

1. sudo apt-get install libtcmalloc-minimal4
2. dpkg -L libtcmalloc-minimal4

2번을 통해 설치된 TCMalloc의 경로를 저장합니다

Training object detection

How to RUN?

Single gpu

LD_PRELOAD="/usr/lib/x86_64-linux-gnu/libtcmalloc_minimal.so.4.3.0" python train.py

Mutli gpu

LD_PRELOAD="/usr/lib/x86_64-linux-gnu/libtcmalloc_minimal.so.4.3.0" python train.py --multi_gpu

Caution!

본 레포지토리는 single-GPU, multi-GPU 환경에서의 학습 및 추론을 지원합니다.
Single-GPU 사용 시, GPU 번호를 설정하여 사용할 수 있습니다.
python train.py --help를 살펴보시고 학습에 필요한 설정값을 argument 인자값으로 추가해주세요.



5. Eval

Training 이후 모델의 정확도 평가 및 추론 속도를 계산합니다.

계산 항목 : FLOPs, MIoU metric, Average inference time

자세한 항목은 arguments를 참고해주세요.

1. PASCAL VOC EVALUATE

python eval_voc.py --checkpoint_dir='./checkpoints/' --weight_path='weight.h5' --backbone_name='efficient_lite_v0' ... etc

PASCAL VOC의 Precision-Recall graph 시각화 기능을 제공합니다.

eval_voc.py를 한 번 이상 실행해야 합니다.

cd experiemnts
python draw_prec_rec_curve.py


2. COCO2017 EVALUATE

추가 예정입니다.


6. Predict

Web-camera 또는 저장된 비디오를 실시간으로 추론할 수 있습니다.

Web-cam 실시간 추론

python predict_webcam.py



7. Export

학습된 모델을 다양한 프레임워크로 export하는 기능을 제공합니다.

예를들어, tensorflow model을 ONNX로 변환할 수 있으며, 역으로 ONNX 모델을 tensorflow 모델로 재변환합니다.

Tensorflow model to another frameworks

  • 7.1 Convert to tensorRT

  • 7.2 Convert to frozen graph

  • 7.3 Convert to ONNX

  • 7.4 Convert to tensorflow_js

  • 7.5 Convert to tensorflow_lite

ONNX model to tensorflow

  • 7.6 Convert ONNX to tf saved model + frozen graph



7.1 Convert to tensorRT


tensorRT를 변환하기 위해서는 tensorRT 엔진을 빌드해야 합니다.

본 레포지토리에서는 tf-trt를 이용하여 tensorRT 엔진을 빌드합니다.

CUDA, CuDNN, TensorRT files


현재 작성된 코드 기준으로 사용된 CUDA 및 CuDNN 그리고 TensorRT version은 다음과 같습니다.
클릭 시 설치 링크로 이동합니다.
CUDA 및 CuDNN이 사전에 설치가 완료된 경우 생략합니다.


CUDA : CUDA 11.1

CuDNN : CuDNN 8.1.1

TensorRT : TensorRT 7.2.2.3


7.1.1 Install TensorRT


가상 환경을 활성화합니다. (Anaconda와 같이 가상환경을 사용하지 않은 경우 생략합니다)

conda activate ${env_name}

TensorRT를 설치한 디렉토리로 이동하여 압축을 해제하고 pip를 업그레이드 합니다.

tar -xvzf TensorRT-7.2.2.3.Ubuntu-18.04.x86_64-gnu.cuda-11.1.cudnn8.0.tar.gz
pip3 install --upgrade pip

편집기를 이용하여 배시 쉘에 접근하여 환경 변수를 추가합니다.

sudo gedit ~/.bashrc
export PATH="/usr/local/cuda-11.1/bin:$PATH"
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/park/TensorRT-7.2.2.3/onnx_graphsurgeon
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64:/usr/local/cuda/extras/CUPTI/lib64:/home/park/TensorRT-7.2.2.3/lib"

TensorRT 파이썬 패키지를 설치합니다.

cd python
python3 -m pip install tensorrt-7.2.2.3-cp38-none-linux_x86_64.whl

cd ../uff/
python3 -m pip install uff-0.6.9-py2.py3-none-any.whl

cd ../graphsurgeon
python3 -m pip install graphsurgeon-0.4.5-py2.py3-none-any.whl

cd ../onnx_graphsurgeon
python3 -m pip install onnx_graphsurgeon-0.2.6-py2.py3-none-any.whl

terminal을 열어서 설치가 잘 되었는지 확인합니다.

test_python


7.1.2 Convert to TF-TensorRT


TF-TRT 변환 작업 전 사전 학습된 tensorflow saved model (.pb) 이 필요합니다.
tensorflow saved model이 없는 경우 7.1.3 절차를 따르고, 있는 경우에는 7.1.4로 넘어가세요.

  • 7.1.3 tensorflow saved model이 없는 경우


    본 레포지토리에서 train.py를 통해 학습된 가중치가 있는 경우 graph model로 변환하는 기능을 제공합니다.


    train.py에서 --saved_model argument로 그래프 저장 모드를 활성화합니다. 그리고 학습된 모델의 가중치가 저장된 경로를 추가해줍니다.

      python train.py --saved_model --saved_model_path='your_model_weights.h5'
    

    변환된 graph model의 기본 저장 경로는 './checkpoints/export_path/1' 입니다.

    saved_model_path


  • 7.1.4 Converting

    (.pb) 파일이 존재하는 경우 아래의 스크립트를 실행하여 변환 작업을 수행합니다.

      python convert_to_tensorRT.py ...(argparse options)
    

    TensorRT 엔진을 통해 모델을 변환합니다. 고정된 입력 크기를 바탕으로 엔진을 빌드하니 스크립트 실행 전 --help 인자를 확인해주세요.


    아래와 같은 옵션을 제공합니다.

    모델 입력 해상도 (--image_size), .pb 파일 디렉토리 경로 (input_saved_model_dir)

    TensorRT 변환 모델 저장 경로 (output_saved_model_dir), 변환 부동소수점 모드 설정 (floating_mode)




7.2 Convert to frozen graph


다양한 환경에 쉽게 배포하기 위해 tensorflow-keras model을 frozen graph로 변환합니다.

train.py를 통해 학습된 모델 가중치가 필요합니다.

모델 가중치 저장 경로 및 백본 이름 등 필요한 arguments를 확인해주세요.

python convert_frozen_graph.py --help

image

모델 출력에 post-processing을 추가할 경우 아래와 같은 인자를 추가해주세요.

python convert_frozen_graph.py --include_postprocess

변환이 완료되면 아래와 같은 경로(기본 저장 경로)에 .pb 파일과 .pbtxt 파일이 생성됩니다.


image



7.3 Convert to ONNX


학습된 tensorflow model을 ONNX 모델로 변환합니다.

ONNX로 변환하기 위해서 7.2 step의 frozen graph 변환 과정을 수행해야 합니다.


pip install tf2onnx
 
python -m tf2onnx.convert --input ./your_frozen_graph.pb --output ./frozen_to_onnx_model.onnx --inputs x:0 --outputs Identity:0 --opset 13

제공되는 변환 옵션은 다음과 같습니다.

--input : Frozen graph model 저장 경로
--output : ONNX 모델 저장 경로
--inputs : Frozen graph 모델 입력 namespace
--outputs : Frozen graph 모델 출력 namespace
--opset : ONNX version

아래와 같이 변환하는 경우,

python -m tf2onnx.convert --input ./checkpoints/converted_frozen_graph/frozen_graph.pb --output ./checkpoints/converted_frozen_graph/onnx_model.onnx --inputs x:0 --outputs Identity:0 --opset 13

ONNX 모델 파일(.onnx)이 생성됩니다.

image



7.4 Convert to tensorflow_js


Web (javascript)에서 추론이 가능하도록 tensorflow_js 컨버팅 기능을 제공합니다.

7.2 step의 frozen graph 변환 작업을 먼저 해야합니다.


tensorflowjs_converter your_frozen_graph.pb ./output_dir/ --input_format=tf_frozen_model --output_node_names='Identity'

추가 변환 옵션은 --help로 확인할 수 있습니다.

변환 시 양자화를 하는 경우 --quantize_float16 를 추가합니다.


tensorflowjs_converter ./checkpoints/converted_frozen_graph/frozen_graph.pb ./checkpoints/converted_tfjs/ --input_format=tf_frozen_model --output_node_names='Identity' --quantize_float16 

변환 결과는 다음과 같습니다.

image


tensorflow-js로 모델 용량에 비례하여 바이너리 파일(.bin)과 모델 정보를 포함하는 model.json 파일이 생성됩니다.

실제 웹에서 추론 가능한 샘플 코드는 다음과 같습니다.

HTML 페이지에서 tensorflow_js를 import 합니다.


<script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@3.19.0/dist/tf.min.js"></script>

입력 데이터는 video element 또는 canvas의 이미지를 입력으로 사용합니다.

학습된 모델의 이미지 크기에 맞게 조정합니다.

const model = await tf.loadGraphModel('model.json');
const inputImageTensor = tf.expandDims(tf.cast(tf.browser.fromPixels(videoElement), 'float32'), 0);
const resizedImage = tf.image.resizeBilinear(inputImageTensor, [300, 300]);
const normalizedImage = tf.div(resizedImage, 255);

// post-processing이 포함된 경우 모델 최종 출력의 shape은 (N, 6) 입니다.
// N은 검출된 샘플의 개수
// 각 샘플마다 다음과 같은 데이터[x_min, y_min, x_max, y_max, scores, labels]를 포함합니다.
var output = await model.executeAsync(normalizedImage);

output = tf.squeeze(output, 0); // [Batch, N, 6] -> [N, 6]
    
var boxes = output.slice([0, 0], [-1, 4]); // [N, 4]
var scores = output.slice([0, 4], [-1, 1]); // [N, 1]
var labels = output.slice([0, 5], [-1, 1]); // [N, 1]

// 메모리 해제
tf.dispose(output);
tf.dispose(boxes);
tf.dispose(scores);
tf.dispose(labels);


7.5 Convert to tensorflow_lite


모바일 Android, ios, raspberry pi와 같은 edge device에서 고속 추론이 가능하도록 tflite 변환 기능을 제공합니다.

양자화를 적용하는 경우 변환 옵션은 다음과 같습니다.


GPU : float16

CPU : int8 (TODO)


python convert_to_tflite.py --checkpoint_dir='./checkpoints/' \
                            --model_weights='your_model_weights.h5' \
                            --backbone_name='efficient_lite_v0' \
                            --num_classes=21 \
                            --export_dir='./checkpoints/tflite_converted/' \
                            --tflite_name='tflite.tflite'

변환이 완료된 경우 저장 경로에 .tflite 파일이 생성됩니다.


image

변환 확인을 위해 스크립트를 실행합니다.

python convert_to_tflite.py --export_dir='./checkpoints/tflite_converted/' \
                            --tflite_name='tflite.tflite' \
                            --test


7.6 Convert ONNX to tf saved model + frozen graph


외부 프레임워크에서 학습된 모델 (e.g. pytorch)을 tensorflowjs, tflite 등 웹 및 엣지 디바이스에서 쉽게 추론할 수 있도록 변환 기능을 제공합니다.


ONNX로 컨버팅된 모델 파일(.onnx)이 필요합니다!

python convert_onnx_to_tf.py --onnx_dir='your_onnx_model.onnx' \
                             --output_dir='onnx2tf_converted'



8.Demo

Single image inference test, Human detection 등 다양한 task의 detection demo를 제공합니다.


8.1 Single image inference test

학습된 가중치를 이용하여 단일 이미지에 대한 추론 테스트를 지원합니다.

데모 실행 절차는 다음과 같습니다.


  1. README.md 상단에 있는 PASCAL VOC 데이터셋으로 사전 학습된 EfficientNet-Lite-B0 모델 가중치를 다운로드 받습니다.

  2. 저장받은 가중치를 레포지토리의 'checkpoints/' 경로를 복사한 뒤, 파이썬 스크립트를 실행합니다.
    여기서 --weight_name을 저장받은 케라스 가중치 파일 (.h5)에 맞게 변경합니다.

python predict_image.py --backbone_name='efficient_lite_v0' --batch_size=1 --num_classes=21 --image_dir='./inputs/' --image_format='div' --weight_name='download_your_weights_name.h5'

Caution : 자세한 옵션은 python predict_image.py --help를 통해 확인해주세요.



8.2 Human detection

PASCAL VOC 07+12, COCO2017에서 human(person) class에 해당하는 샘플만 추출하여 학습한 모델입니다.

총 클래스 수 : 2 (background + human)

  1. README.md 상단에 있는 Human detection 데이터셋으로 사전 학습된 EfficientNet-Lite-B0 모델 가중치를 다운로드 받습니다.

  2. 단일 이미지 추론 모드는 predict_image.py를 이용하여 추론을 수행합니다.

python predict_image.py --backbone_name='efficient_lite_v0' --batch_size=1 --num_classes=2 --image_dir='./inputs/' --image_format='div' --weight_name='download_your_weights_name.h5'
  1. 동영상 추론
python predict_webcam.py --backbone_name='efficient_lite_v0' --num_classes=2 --image_format='div' --weight_name='download_your_weights_name.h5'