[IROS 2025] VPOcc: Exploiting Vanishing Point for 3D Semantic Occupancy Prediction

This repository contains the official implementation of VPOcc: Exploiting Vanishing Point for 3D Semantic Occupancy Prediction.

📋 Contents

Installation
Preparing Dataset
Results
Training
Evaluation
Test
Visualization
Acknowledgements
BibTeX

1. Installation

Our code is based on CUDA 11.3 and PyTorch 1.11.0.

a. Download the source code:

git clone https://github.com/vision3d-lab/VPOcc.git
cd VPOcc

b. Create conda environment and install PyTorch 1.11.0 with CUDA 11.3:

conda create -n vpocc python=3.8 -y
conda activate vpocc
conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch

c. Install MMCV and MMDet with OpenMIM:

pip install -U openmim
mim install mmengine==0.9.0 
mim install mmcv==2.0.1
mim install mmdet==3.2.0

d. Install additional requirements:

pip install -r requirements.txt

e. Initialize environment:

export PYTHONPATH=`pwd`:$PYTHONPATH
wandb init

2. Preparing Dataset

We follow the steps from Symphonies.

a. Dataset

SemanticKITTI: Download RGB images, calibration files, and preprocess the labels (refer to VoxFormer or MonoScene documentation).
SSCBench-KITTI360: Refer to SSCBench-KITTI360 Dataset Guide.

b. Depth Prediction

SemanticKITTI: Generate depth predictions with pre-trained MobileStereoNet (see VoxFormer Preprocess Guide).
SSCBench-KITTI360: Follow the same procedure as SemanticKITTI, but adapt disparity values following issue.

c. Vanishing Point Extraction

Use pre-trained NeurVPS to extract vanishing points.
Download pre-extracted vanishing points and extraction code from Hugging Face Dataset.

d. Data Structure (Softlink under ./data)

./data
├── SemanticKITTI
│   ├── dataset 
│   ├── labels
│   ├── depth
│   └── vanishing_points
└── SSCBench-KITTI360
    ├── data_2d_raw
    ├── depth
    ├── monoscene_preprocess
    └── vanishing_points

e. Pretrained Weights

Pre-trained MaskDINO → place under ./backups

./VPOcc
├── backups
├── ckpts
├── configs
├── data
├── maskdino
├── outputs
├── ssc_pl
└── tools

3. Results

Dataset	Validation (IoU / mIoU)	Test (IoU / mIoU)	Model
SemanticKITTI	44.98 / 16.36 📄 log	44.58 / 16.15 📄 log	model
SSCBench-KITTI360	46.35 / 20.06 📄 log	46.39 / 19.80 📄 log	model

4. Training

a. SemanticKITTI

python tools/train.py --config-name config.yaml trainer.devices=4 \
+data_root=./data/SemanticKITTI \
+label_root=./data/SemanticKITTI/labels \
+depth_root=./data/SemanticKITTI/depth \
+log_name=train_semantickitti \
+model_name=vpocc \
+seed=53

b. KITTI-360

python tools/train.py --config-name config_kitti_360.yaml trainer.devices=4 \
+data_root=./data/SSCBench-KITTI360 \
+label_root=./data/SSCBench-KITTI360/monoscene_preprocess/labels \
+depth_root=./data/SSCBench-KITTI360/depth \
+log_name=train_kitti360 \
+model_name=vpocc \
+seed=53

5. Evaluation

a. SemanticKITTI

python tools/evaluate.py --config-name config.yaml trainer.devices=1 \
+ckpt_path=./ckpts/semantickitti.ckpt \
+data_root=./data/SemanticKITTI \
+label_root=./data/SemanticKITTI/labels \
+depth_root=./data/SemanticKITTI/depth \
+log_name=eval_semantickitti \
+model_name=vpocc \
+seed=53

b. KITTI-360

python tools/evaluate.py --config-name config_kitti_360.yaml trainer.devices=1 \
+ckpt_path=./ckpts/kitti360.ckpt \
+data_root=./data/SSCBench-KITTI360 \
+label_root=./data/SSCBench-KITTI360/monoscene_preprocess/labels \
+depth_root=./data/SSCBench-KITTI360/depth \
+log_name=eval_kitti360 \
+model_name=vpocc \
+seed=53

6. Test

a. SemanticKITTI (hidden test set)

python tools/test_semantickitti.py --config-name config.yaml trainer.devices=1 \
+ckpt_path=./ckpts/semantickitti.ckpt \
+data_root=./data/SemanticKITTI \
+label_root=./data/SemanticKITTI/labels \
+depth_root=./data/SemanticKITTI/depth \
+log_name=test_semantickitti \
+model_name=vpocc \
+seed=53

b. KITTI-360

python tools/test_kitti360.py --config-name config_kitti_360.yaml trainer.devices=1 \
+ckpt_path=./ckpts/kitti360.ckpt \ \
+data_root=./data/SSCBench-KITTI360 \
+label_root=./data/SSCBench-KITTI360/monoscene_preprocess/labels \
+depth_root=./data/SSCBench-KITTI360/depth \
+log_name=test_kitti360 \
+model_name=vpocc \
+seed=53

7. Visualization

Outputs of the validation set are saved in ./outputs.

a. SemanticKITTI

python tools/generate_outputs.py --config-name config.yaml trainer.devices=1 \
+ckpt_path=./ckpts/semantickitti.ckpt \
+data_root=./data/SemanticKITTI \
+label_root=./data/SemanticKITTI/labels \
+depth_root=./data/SemanticKITTI/depth \
+log_name=vis_semantickitti \
+model_name=vpocc

b. KITTI-360

python tools/generate_outputs.py --config-name config_kitti360.yaml trainer.devices=1 \
+ckpt_path=./ckpts/kitti360.ckpt \
+data_root=./data/SSCBench-KITTI360 \
+label_root=./data/SSCBench-KITTI360/monoscene_preprocess/labels \
+depth_root=./data/SSCBench-KITTI360/depth \
+log_name=vis_kitti360 \
+model_name=vpocc

You can visualize the predicted data. In auto mode, all visualizations are saved automatically, while manual mode opens an interactive window.

c. SemanticKITTI

python tools/visualize.py --config-name config.yaml \
+path=PTAH/TO/PKL/DIR \
+output_dir=PTAH/TO/OUTPUT/DIR \
+save_mode={auto/manual}

d. KITTI-360

python tools/visualize.py --config-name config_kitti360.yaml \
+path=PTAH/TO/PKL/DIR \
+output_dir=PPTAH/TO/OUTPUT/DIR \
+save_mode={auto/manual}

8. Acknowledgements

Special thanks to Symphonies and many thanks to the following excellent projects:

9. BibTeX

Comming soon :D

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
.vscode		.vscode
configs		configs
maskdino		maskdino
ssc_pl		ssc_pl
tools		tools
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

[IROS 2025] VPOcc: Exploiting Vanishing Point for 3D Semantic Occupancy Prediction

📋 Contents

1. Installation

2. Preparing Dataset

3. Results

4. Training

5. Evaluation

6. Test

7. Visualization

8. Acknowledgements

9. BibTeX

About

Uh oh!

Releases

Packages

Languages

License

vision3d-lab/VPOcc

Folders and files

Latest commit

History

Repository files navigation

[IROS 2025] VPOcc: Exploiting Vanishing Point for 3D Semantic Occupancy Prediction

📋 Contents

1. Installation

2. Preparing Dataset

3. Results

4. Training

5. Evaluation

6. Test

7. Visualization

8. Acknowledgements

9. BibTeX

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages