CNN误差反传时旋转卷积核的简明分析

CNN误差反传时旋转卷积核的简明分析,第1张

由 Demi 于 星期二, 2018-09-04 17:31 发表

CNN(卷积神经网络)的误差反传(error back propagaTIon)中有一个非常关键的的步骤就是将某个卷积(Convolve)层的误差传到前一层的池化(Pool)层上,因为在CNN中是2D反传,与传统神经网络中的1D反传有点细节上的不同,下面通过一个简单的例子来详细分解一下这个反传步骤。

假设在一个CNN网络中,P代表某个池化层,K代表卷积核,C代表卷基层,首先来看一下前向(feed forward)计算,从一个池化层经过与卷积核(Kernel)的运算得到卷积层:

将前向计算的步骤进行分解,可以得到以下公式:

下面根据这个前向计算的步骤来分解出反向传播的步骤:

首先要确定误差传播的目的地,从deltaC到deltaP,所以先从deltaP1开始分析

从前面的前向计算过程中可以找出P1参与了C中哪些元素的计算,并且可以根据对应的前向计算得出反向传播的计算公式:

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第2张

依次类推,还有如下公式:

对于P2

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第3张

对于P3

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第4张

对于P4

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第5张

对于P5

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第6张

一直可以推到P9

总结这9个反向传播的公式到一起:

CNN误差反传时旋转卷积核的简明分析,CNN误差反传时旋转卷积核的简明分析,第7张

进一步可以发现,这9个公式可以用如下的卷积过程来实现:

至此,从计算的细节上解释了为什么反向传播的时候要把卷积核旋转180°,并采用full的形式来进行卷积运算。

(注:上文所说的“卷积”被认为是一种不会180°旋转第二个因子的的计算过程,实际上matlab中的的conv2(a,b)会自动180°旋转b,换句话说,在matlab中实现这个步骤的时候不用提前旋转,留给conv2函数自行旋转即可)

本文转自:CSDN - zy3381,转载此文目的在于传递更多信息,版权归原作者所有。
原文链接:https://blog.csdn.net/zy3381/arTIcle/details/44409535

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2716254.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-17
下一篇 2022-08-17

发表评论

登录后才能评论

评论列表(0条)

保存