激活函数(Activation Function),就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。
如果不用激活函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这种情况就是最原始的感知机。
如果使用的话,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# _ooOoo_
# o8888888o
# 88" . "88
# ( | - _ - | )
# O\ = /O
# ____/`---'\____
# .' \\| |// `.
# / \\|||:|||// \
# / _|||||-:- |||||- \
# | | \\\ - /// | |
# | \_| ''\---/'' | _/ |
# \ .-\__ `-` ___/-. /
# ___`. .' /--.--\ `. . __
# ."" '< `.___\_<|>_/___.' >'"".
# | | : `- \`.;`\ _ /`;.`/ - ` : | |
# \ \ `-. \_ __\ /__ _/ .-` / /
# ==`-.____`-.___\_____/___.-`____.-'==
# `=---='
'''
@Project :pythonalgorithms
@File :Activationfunction.py
@Author :不胜人生一场醉@Date :2021/8/11 0:14
'''
import numpy as np
from matplotlib import pyplot as plt
def drawpic(x, y, label=' ', title=' '):
plt.figure(figsize=(10, 8))
ax = plt.gca() # 通过gca:get current axis得到当前轴
plt.rcParams['font.sans-serif'] = ['SimHei'] # 绘图中文
plt.rcParams['axes.unicode_minus'] = False # 绘图负号
plt.plot(x, y, label=label)
# 设置图片的右边框和上边框为不显示
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
# 挪动x,y轴的位置,也就是图片下边框和左边框的位置
# data表示通过值来设置x轴的位置,将x轴绑定在y=0的位置
ax.spines['bottom'].set_position(('data', 0))
# axes表示以百分比的形式设置轴的位置,即将y轴绑定在x轴50%的位置
ax.spines['left'].set_position(('axes', 0.5))
# ax.spines['left'].set_position(('data', 0))
plt.title(title)
plt.legend(loc='upper right')
plt.show()
if __name__ == '__main__':
std = 0.1 # 标准差为0.1
avg = 1 # 平均值为1
x = np.linspace(avg - 5 * std, avg + 5 * std, 100)
y = normaldistribution(x, avg, std)
drawpic(x, y, 'normaldistribution', 'normal distribution function')
x = np.linspace(-5, 5, 100)
y = sigmoid(x)
drawpic(x, y, 'sigmoid', 'sigmoid Activation function')
y = tanh(x)
drawpic(x, y, 'tanh', 'tanh Activation function')
y = stepfunction(x)
drawpic(x, y, 'tanh', 'step Activation function')
y = relu(x)
drawpic(x, y, 'relu', 'relu Activation function')
y = leakyrelu(x)
drawpic(x, y, 'leakyrelu', 'leakyrelu Activation function')
y = softmax(x)
drawpic(x, y, 'softmax', 'softmax Activation function')
# 求正态分布值,avg表示期望值,std表示标准差
def normaldistribution(x, avg=0, std=1):
return np.exp(-(x - avg) ** 2 / (2 * std ** 2)) / (np.sqrt(2 * np.pi) * std)
# return np.exp(-(x - avg) ** 2 / (2 * std ** 2)) / (math.sqrt(2 * math.pi) * std)
# Sigmoid函数
# Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。
# 在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间
def sigmoid(x):
return 1 / (1 + np.power(np.e, -x))
# Tanh函数
# Tanh是双曲函数中的一个,Tanh()为双曲正切。
# 在数学中,双曲正切“Tanh”是由基本双曲函数双曲正弦和双曲余弦推导而来。
# 函数tanh(蓝色)和函数sigmoid(橙色)一样,在其饱和区的接近于0,都容易产生后续梯度消失、计算量大的问题
def tanh(x):
return (np.exp(x) - np.exp(-x)) / (np.exp(x) + np.exp(-x))
# 阶跃函数
def stepfunction(x):
return np.array(x > 0, dtype=np.int32)
# ReLU函数
# Relu激活函数(The Rectified Linear Unit),用于隐层神经元输出。
# Relu会使一部分神经元的输出为0,这样就造成了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。
def relu(x):
return np.maximum(0, x)
# leaky ReLU函数
def leakyrelu(x):
return np.maximum(0.01 * x, x)
# softmax函数
# softmax函数可以看做是Sigmoid函数的一般化,用于多分类神经网络输出。
def softmax(x):
return np.exp(x) / np.sum(np.exp(x))