Skip to content

EfficientNet

Qin Yuxiang edited this page Oct 29, 2019 · 2 revisions

EfficientNet

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Mingxing Tan, Quoc V. Le

ICML 2019

链接:https://arxiv.org/abs/1905.11946

主要思想

’d‘:网络的深度,即ResNet-18到ResNet-152。

‘w’:网络的宽度,即网络中一层并列的卷积操作数量。

‘r’:分辨率,即喂入网络的图像尺寸大小,丛原有的32*32到224*224再到后来的299*299。

文章主要分析了网络中深度'd'、宽度'w'和分辨率'r'之间的平衡,通过实验发现对网络深度、宽度和分辨率中的任何变量进行调整都可以提高精度,但是当模型足够大时,这种放大的收益会减弱。

为了能够获得更好的精度和效率,平衡三者的参数至关重要。

技术总结

由于我们喂入网络时使用固定大小的图像3*224*224,但是B0-B7分别需要不同的分辨率,所以我们在将数据喂入神经网络时并没有按照论文中给出的分辨率信息。

Clone this wiki locally