卷积神经网络的理解

好吧,教科书还是百科上的解释,已经完全让人头大,怎么才能把卷积神经网络理解了呢?

先从最基本的公式入手吧。

这个公式的意思就是,当锚定某个图像的特定像素点后,其周围的若干像素点都对该点有影响。卷积神经网络就是依靠汇总这些影响来预测的。f是锚定点变量的函数,g是锚定点周围任意一点的函数。周围包括锚定点本身都会对中心点造成影响。计算时,就是利用这种影响,得到预测值。

然而,因为g函数针对的是卷积核,为t-x。在实际情况中,往往位置会和原来的图片发生颠倒,因此,需要将g颠倒一下再相乘,可能这个过程叫做卷积。

如果不理解,可以看下面这个例子。

假设随机设定图像的某一点为中心点,即f(x,y);那么其左上方的点为f(x-1,y+1)。根据公式,g(t-x),得到响应的g函数为:原点(x,y)-造成影响的点(x-1,y+1)=(x,y)-(x-1,y+1)=(x-(x-1),y-(y+1))=(1,-1)。这里的t是原点,x是影响t的点。如图:

图1 f函数和g函数关系示意图

原图左上方的点(-1,1)刚好对应卷积核右下方的点(1,-1),则只要将卷积核旋转180度,两个图像则可以完全匹配,可以进行对应位置的四则运算,起到图片修改的作用。

这便是卷积神经网路的原理了。

评论

发表评论

了解 数据控|突破是我们的每一步 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读