backbones/vgg at master · AmberzzZZ/backbones

Name	Name	Last commit message	Last commit date
parent directory ..
image	image
GroupConv.py	GroupConv.py
convert.py	convert.py
deploy.py	deploy.py
readme.md	readme.md
repvgg.py	repvgg.py
ssd_back.py	ssd_back.py
test_repvgg.py	test_repvgg.py
vgg.py	vgg.py

vs AlexNet

主要区别就是加深了，用连续的小尺寸卷积核代替大尺寸

vgg结构

结构非常统一，3x3的卷积+2x2的pooling+全连接
vgg16: 图中D
vgg19: 图中E

LRN: 不多说了，“从后面的ResNet、DenseNet、SENet等网络就能看出LRN的影响力并不大，已经被drop、BN所取代”

可添加: BN，Dropout

缺点

三个全连接层导致参数量贼大，慢的一匹
vgg16: 134,301,514
vgg19: 139,611,210
85%以上的参数量都来自于全连接层

SSD back

就是看SSD里面用了它，才记录一下，SSD用vgg16做backbone，
* 前四层conv+pooling和vgg16一样，conv4输出38x38x512
* 第五个conv之后的pooling由2x2 s2变成 3x3 s1，输出19x19x1024
* 接下来的尾巴是新增的
    ** conv6是3x3x1024的空洞卷积，输出19x19x1024u
    ** conv7是1x1x1024的conv，输出19x19x1024u
    ** conv8是1x1x256和3x3x512 s2的conv，输出10x10x512
    ** conv9都是1x1x128和3x3x256 s2的conv，输出5x5x256
    ** conv10、conv11都是1x1x128和3x3x256 s1 p0的conv，输出3x3x256和1x1x256
    ** 所有的conv都是conv-relu
多尺度输出: conv4 conv7 conv8 conv9 conv10 conv11都接上检测头作为输出

总结下来新增的层就是空洞卷积层+一系列bottleneck

reference: https://www.zybuluo.com/huanghaian/note/1752569

ssd300六个输出: [38,19,10,5,3,1], 对应名字为conv4_3、conv7、conv8_2、conv9_2、conv10_2
ssd512七个输出: [64,32,16,8,4,2,1], 相比ssd300尾巴上多了一个convblock

rescale
    发现特征图conv4_3比较靠前，l2范数比较大，跟后面的特征图数值不平衡，
    因此对conv4_3进行l2 norm
    可学习参数

repvgg

official repo: https://github.com/DingXiaoH/RepVGG

[model zoo]:
RepVGG-A0, RepVGG-A1, RepVGG-A2,
RepVGG-B0,
RepVGG-B1, RepVGG-B1g2, RepVGG-B1g4,
RepVGG-B2, RepVGG-B2g2, RepVGG-B2g4,
RepVGG-B3, RepVGG-B3g2, RepVGG-B3g4,
RepVGG-D2se,
RepVGGplus-L2pse,      // leaderboard上面超越了swin

[RepVGG & RepVGGplus]:
* deeper
* has three auxiliary classifiers: 多了3个辅助分类器，只存在于训练阶段


[一些精度对标]：
RepVGG-A0        ---      ResNet18
RepVGG-A2/B1g4   ---      EfficientNet-b0
RepVGG-B1g2      ---      ResNet50
RepVGG-B2g4      ---      ResNeXt50
RepVGG-B2        ---      ResNeXt101/EfficientNet-b3


[training-time model & deploy(inference-time) model]:
* run convert.py 进行转换
* structural re-parameterization technique: 重新参数化，模型压缩中的一类常见手段

主要关注test-time的线形合并
1. multi-branch必须只包含线形单元：relu在外面
2. test-time reparam

**** basic architecture  *****
basic block由2/3个branch组成：bn / conv3-bn / conv1-bn，有s2的block无bn-branch
然后在分支外面add & (se) & relu
三个线形分支在测试阶段可以线形合并：全部转换成3x3的conv-bias单元然后合并

**** model zoo  *****
repvggplus

**** convert *****
源代码: repvgg.py - repvgg_model_convert
       repvggplus.py - switch_repvggplus_to_deploy


复现issue：
* 手动padding：这个之前也处理很多次了，torch和tf的padding模式不一样，torch padding是填两边，tf的same padding是填一边，所以需要显示地手动zeropadding
* train/test model：id path上group conv的kernel需要注意，为了使得gconv以后输出等于输入，kernel首先肯定是3x3只有中心是1，其次每个 channel group里面，只有一个通道是激活的

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

vgg

vgg

readme.md

vs AlexNet

vgg结构

缺点

SSD back

repvgg

Files

vgg

Directory actions

More options

Directory actions

More options

Latest commit

History

vgg

Folders and files

parent directory

readme.md

vs AlexNet

vgg结构

缺点

SSD back

repvgg