Twins

1. 概述

Twins 网络包括 Twins-PCPVT 和 Twins-SVT，其重点对空间注意力机制进行了精心设计，得到了简单却更为有效的方案。由于该体系结构仅涉及矩阵乘法，而目前的深度学习框架中对矩阵乘法有较高的优化程度，因此该体系结构十分高效且易于实现。并且，该体系结构在图像分类、目标检测和语义分割等多种下游视觉任务中都能够取得优异的性能。论文地址。

2. 精度、FLOPs 和参数量

Models	Top1	Top5	Reference top1	Reference top5	FLOPs (G)	Params (M)
pcpvt_small	0.8082	0.9552	0.812	-	3.7	24.1
pcpvt_base	0.8242	0.9619	0.827	-	6.4	43.8
pcpvt_large	0.8273	0.9650	0.831	-	9.5	60.9
alt_gvt_small	0.8140	0.9546	0.817	-	2.8	24
alt_gvt_base	0.8294	0.9621	0.832	-	8.3	56
alt_gvt_large	0.8331	0.9642	0.837	-	14.8	99.2

注：与 Reference 的精度差异源于数据预处理不同。

3. 基于 V100 GPU 的预测速度

Models	Crop Size	Resize Short Size	FP32 Batch Size=1 (ms)	FP32 Batch Size=4 (ms)	FP32 Batch Size=8 (ms)
pcpvt_small	224	256	7.32	10.51	15.27
pcpvt_base	224	256	12.20	16.22	23.16
pcpvt_large	224	256	16.47	22.90	32.73
alt_gvt_small	224	256	6.94	9.01	12.27
alt_gvt_base	224	256	9.37	15.02	24.54
alt_gvt_large	224	256	11.76	22.08	35.12

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Twins.md

Twins.md

Twins

目录

1. 概述

2. 精度、FLOPs 和参数量

3. 基于 V100 GPU 的预测速度

Files

Twins.md

Latest commit

History

Twins.md

File metadata and controls

Twins

目录

1. 概述

2. 精度、FLOPs 和参数量

3. 基于 V100 GPU 的预测速度