ResNet50模型计算过程详解 resnet50结构分析 _生活百科

resnet迄今为止，仍然是最佳的backbone.
resnet的全称为深度残差网络，Deep Residual Network
在resnet的论文Deep Residual Learning for Image Recognition中，作者给出了这样几个模型：resnet18,resnet34,resnet50,resnet101,resnet152.
这些模型，都是由使用残差模块residual block构成的，不然为什么叫做residual network 呢？
那么resnet中的残差模块residual block是怎样的呢？
其实resnet中有两种残差模块：basic residual block 和和 bottleneck residual block，如下图所示：

文章插图
左边为basic residual block,右边为bottleneck residual block 。
在resnet18,resnet34中，使用的是左边的basic residual block
在resnet50,resnet101,resnet152中使用的是右边的bottleneck residual block.
上一篇文章中我们详细介绍了resnet18的计算过程。
这篇文章主要详细介绍resnet50的计算过程。

文章插图
如论文中的 Table-1所示，resnet50的模型结构是表中的第5列。
给一张224x224x3的图片img，我们输入到resnet50模型，看看它是如何得到模型输出的。
我们先把图片矩阵变换为：3x224x224
3x224x224的img
经过kernel_size=7,in_channel=3,output_channel=64,stride=2,padding=3的same卷积，bn,relu得到64x112x112的feature map
接着经过kernel_size=3,stride=2的map pooling,得到64x56x56的feature map: F4

接着就开始经过（3+4+6+3=16）16个bottleneck residual block 。这16个bottleneck residual block中，前3个的3×3卷积的channel数为64，接着的4个bottlneck residual block中的3×3卷积的channel数为128，接着的6个bottleneck residual block中的3×3卷积的channel数为256，最后4个bottleneck residual block中的 3×3卷积的channel数为512 。

得到F4后，将其输入到bottleneck residual block中，得到256x56x56的feature map：F5

从F4到F5的计算过程，就是bottleneck residual block中的计算过程，详细如下：
F4经过kernel size = 1,in_channel=64,out_channel=64,stride=1的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=64的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=256的卷积，bn得到256x56x56的feature map:F4_1
将F4经过一个kernel size=1,in_channel=64,out_channel=256,stride=1的卷积，bn得到256x56x56的feature map:F4_2
F4_1+F4_2后，再经过激活函数relu得到256x56x56 的 F5

这就是一个典型的经典的bottleneck residual block的计算过程。
这里面有一个细节要注意：当F4和F4_1的维度不相等时，我们就用一个1×1的卷积，将F4进行维度变换得到F4_2. 保证F4_2在feature map 的size和channel都与F4_1相等时，再将F4_1+F4_2，再经过relu得到F5
如果F4和F4_1在size 和维度都相等时，F4_2=F4,然后进行 F4_1+F4_2,经过relu得到 F5.
从64x56x56的F4到256x56x56的F5,就是我们16个bottleneck residual block的第1个block.
F5经过第2个bottleneck residual block得到256x56x56 的 F6,

详细过程：
F5经过kernel size = 1,in_channel=256,out_channel=64,stride=1的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=64的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=256的卷积，bn得到256x56x56的feature map:F5_1
F5_1+F5后，再经过激活函数relu得到256x56x56 的 F6

这一步我们没有对F5进行维度变换得到F5_2,因为F5与F5_1维度相同，可以直接相加
这是我们16个 bottleneck residual block中的第2个block.
F6经过第3个 bottleneck residual block，得到256x56x56 的 F7

详细过程：
F6经过kernel size = 1,in_channel=256,out_channel=64,stride=1的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=64的卷积，bn,relu,得到64x56x56的feature map.
接着经过一个kernel size=3,in_channel=64,out_channel=256的卷积，bn得到256x56x56的feature map:F6_1
F6_1+F6后，再经过激活函数relu得到256x56x56 的 F7

注意到，前3个bottleneck residula block中的3×3的卷积的in_channel=out_channel=64,由于这3个 bottleneck residula block中3×3卷积的channel数是一样的，我们通常把他们3个 block合称为resnet50的block1，或者conv2_x,或者layer1.
F7经过第4个bottleneck residual block, 得到512x28x28 的 F8

详细如下：
F7经过kernel size = 1,in_channel=256,out_channel=128，stride=2的卷积，bn,relu,得到128x28x28的feature map.

上一页
1
2
3
下一页

医学专业词汇，希望专业人士给解释一下，心肺复苏、骨骼、护理人模型、针灸人模型这几个词是啥意思

计算机硬件知识介绍计算机硬件组成的基础知识

日历年度是公历吗,中国从什么时候计算日期年份的

降雨量如何计算,降水量怎么计算的以面积为单位

车损险是怎么计算的

硬盘在哪里看大小

2022年春季征兵时间,如何正确计算入伍时间？

如何计算三角形面积_三角形面积的计算公式

什么是aarrr，aarrr模型解析？

产品定价计算公式商品定价的五种方法是什么