ResNet网络详细解析 -6park.com

[返回人工智能首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

ResNet网络详细解析

送交者: 浩瀚宇宙[★★★✦★★★] 于 2019-08-05 11:01 已读 1039 次

浩瀚宇宙的个人频道

+关注

1、 RestNet网络

1.1、 RestNet网络结构

ResNet在2015年被提出，在ImageNet比赛classification任务上获得第一名，因为它“简单与实用”并存，之后很多方法都建立在ResNet50或者ResNet101的基础上完成的，检测，分割，识别等领域里得到广泛的应用。它使用了一种连接方式叫做“shortcut connection”，顾名思义，shortcut就是“抄近道”的意思，下面是这个resnet的网络结构：

它对每层的输入做一个reference（X）, 学习形成残差函数，而不是学习一些没有reference（X）的函数。这种残差函数更容易优化，能使网络层数大大加深。在上图的残差块中它有二层，如下表达式，

其中σ代表非线性函数ReLU。

然后通过一个shortcut，和第2个ReLU，获得输出y。

当需要对输入和输出维数进行变化时（如改变通道数目），可以在shortcut时对x做一个线性变换Ws，如下式。

然而实验证明x已经足够了，不需要再搞个维度变换，除非需求是某个特定维度的输出，如是将通道数翻倍，如下图所示：

由上图，我们可以清楚的看到“实线”和“虚线”两种连接方式，实线的Connection部分 (第一个粉色矩形和第三个粉色矩形) 都是执行3x3x64的卷积，他们的channel个数一致，所以采用计算方式：

Y = F(x) + x，虚线的Connection部分 (第一个绿色矩形和第三个绿色矩形) 分别是3x3x64和3x3x128的卷积操作，他们的channel个数不同(64和128)，所以采用计算方式： y=F(x)+Wx 。其中W是卷积操作，用来调整x的channel维度。

在计算机视觉里，网络的深度是实现网络好的效果的重要因素，输入特征的“等级”随增网络深度的加深而变高。然而在网络深度不断加深的情况下，梯度弥散/爆炸成为训练深层次的网络的障碍，导致导致网络无法收敛。虽然，归一初始化，各层输入归一化，使得可以收敛的网络的深度提升为原来的十倍。虽然网络收敛了，但网络却开始退化（增加网络层数却导致更大的误差），如下图所示：

由上图可知，在一个浅层网络的基础上叠加y=x的层（称identity mappings，恒等映射），可以让网络随深度增加而不退化。这反映了多层非线性网络无法逼近恒等映射网络。

但是，在深度学习中我们希望有更好性能的网络，而网络不退化则不是我们的目的。在 RestNet网络中学习的残差函数是F(x) = H(x) - x, 这里如果F(x) = 0, 那么就是上面提到的恒等映射（H(x) = x）。事实上，RestNet是“shortcut connections”的在connections是在恒等映射下的特殊情况，它没有引入额外的参数和计算的复杂度。假如优化目标函数是逼近一个恒等映射, 而不是0映射（F(x) = 0）或者说恒等映射，那么学习找到对恒等映射的扰动会比重新学习一个映射函数要容易。

1.2、残差块的两种结构

这是文章里面的图，我们可以看到一个“弯弯的弧线“这个就是所谓的”shortcut connection“，也是文中提到identity mapping，这张图也诠释了ResNet的真谛，当然大家可以放心，真正在使用的ResNet模块并不是这么单一，文章中就提出了两种方式：

这两种结构分别针对ResNet34（左图）和ResNet50/101/152（右图），一般称整个结构为一个“building block” 。其中右图又称为“bottleneck design”，目的就是为了降低参数的数目，实际中，考虑计算的成本，对残差块做了计算优化，即将两个3x3的卷积层替换为1x1 + 3x3 + 1x1，如右图所示。新结构中的中间3x3的卷积层首先在一个降维1x1卷积层下减少了计算，然后在另一个1x1的卷积层下做了还原，既保持了精度又减少了计算量。第一个1x1的卷积把256维channel降到64维，然后在最后通过1x1卷积恢复，整体上用的参数数目：1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632，而不使用bottleneck的话就是两个3x3x256的卷积，参数数目: 3x3x256x256x2 = 1179648，差了16.94倍。

对于常规ResNet，可以用于34层或者更少的网络中，对于Bottleneck Design的ResNet通常用于更深的如101这样的网络中，目的是减少计算和参数量。

1.3、ResNet50和ResNet101简单讲解

这里把ResNet50和ResNet101特别提出，主要因为它们的使用率很高，所以需要做特别的说明。给出了它们具体的结构：

上表是Resnet不同的结构，上表一共提出了5中深度的ResNet，分别是18，34，50，101和152，首先看表的最左侧，我们发现所有的网络都分成5部分，分别是：conv1，conv2_x，conv3_x，conv4_x，conv5_x，之后的其他论文也会专门用这个称呼指代ResNet50或者101的每部分。例如：101-layer那列，101-layer指的是101层网络，首先有个输入7x7x64的卷积，然后经过3 + 4 + 23 + 3 = 33个building block，每个block为3层，所以有33 x 3 = 99层，最后有个fc层(用于分类)，所以1 + 99 + 1 = 101层，确实有101层网络；注：101层网络仅仅指卷积或者全连接层，而激活层或者Pooling层并没有计算在内；我们关注50-layer和101-layer这两列，可以发现，它们唯一的不同在于conv4_x，ResNet50有6个block，而ResNet101有23个block，两者之间差了17个block，也就是17 x 3 = 51层。

喜欢浩瀚宇宙朋友的这个贴子的话，

请点这里投票，“赞”助支持！

[举报反馈]·[ID前期主贴发言]·[所有跟帖]·[-->>回复本帖]·[手机扫描浏览分享]·[返回首页]

内容来自网友分享，若违规或者侵犯您的权益，请联系我们

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主前期社区热帖：

美女阿樂穿泳裝還真大......... 10/05/21
大甲媽繞境驚見神乳女孩 10/05/21
亮宇纖維千金人人稱羨的「白富美」 10/05/21
物理治療師換上養眼泳裝　性感美臀配上甜美笑容太迷人 10/05/21
正妹健身房穿運動內衣用設施　側乳若隱若現 10/05/21
台灣網紅試新裙曬長腿短褲大曬翹臀 10/05/21
IG正妹: Ruby鄰居小妹妹好可愛 10/05/21
實況主Zoe 五官秀氣，回眸一笑讓人瞬間戀愛 10/05/21
萌系妹子裘球清新燦笑甜度爆表讓人秒戀愛 10/05/21
清純色女孩林宛璇無辜萌樣晾深溝，有奶有愛男粉絕對相隨 10/05/21
魅惑勾人眼神塗卉妮邪惡視線窺視白皙美腿曲線一覽無遺 10/05/21
白皙皮膚正妹孔安火辣自拍胸型美腿超完美 10/05/21
氣質正妹思思戴口罩露出迷人的眼神讓人陶醉不已 10/05/21
短髮Youtuber少女許瑜白皙的皮膚和美腿真是逆天啊 10/05/21
妖豔妹子miko 邪惡視角讓人心癢癢啊 10/05/21
時裝模特希希超卡哇伊妹子cosplay超胸魯夫 10/05/21
全新ThinkBook 15p开启预售，创意设计就看它了！ 10/05/21
Intel 12代DDR5内存狂飙8008MHz：时序高得离谱 10/05/21
iPhone 13新机再起波澜，iPhone12低至百元，果粉直呼爱疯 10/05/21
据报道Switch OLED新Dock支持4K/60FPS输出 10/05/21

>>>>查看更多楼主社区动态...

[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]