激活函数其中一个重要的作用是加入非线性因素的,解决线性模型所不能解决的问题。 这个解释理解激活函数作用,看这篇文章就够了!这篇文章已经解释的比较清楚。 下面从另一个角度来解释一下激活函数的作用,特征的充分组合。

首先我们看一个简单的感知机如下:

其中x1,x2输入均为特征的输入

激活函数采取sigmoid函数,公式表达如下:

此时,我们可能看不出什么不同,但是根据泰勒展开,

我们能够看到,将x3代码到激活函数的时候,其实激活函数的e^x泰勒展开后,有平方项,有立方项,有更高的项,这些自动能够把输入特征进行两两组合,进行三三组合或者其它的组合。

比如其中的平方项体现了将特征进行两两组合:

这就把原来需要领域知识的专家对特征进行组合的情况,在激活函数运算后,其实也能够起到类似特征组合的作用。

(只要激活函数中有能够泰勒展开的函数,就可能起到特征组合的作用)

这也许能给我们一些思考。

致谢:张梅山老师

推荐阅读:

这样的秘籍也许能帮你通关最近火爆的谷歌“猜画小歌”? 我就不信看完这篇你还搞不懂信息熵 通俗易懂讲解感知机(三)--收敛性证明与对偶形式以及python代码讲解