人工智能(AI):如果机器能够通过学习掌握某种技能,就称其具备了AI的能力。
所以人工智能又叫机器学习:研究如何让计算机具备学习能力。
人工智能首先由图灵提出。
图灵测试:让计算机和人对话,如果人不能判断出他是计算机,那么其就通过了图灵测试。
人工智能的两个学派:
统计学派(基于数学):从机器出发,主要是算法,但是都不能通过图灵测试。【传统机器学习】
仿生学派(基于仿生学):从学习出发,主要是神经网络,发现神经网络越大越深,效果越好,因此提出了深度学习。【深度学习】
深度学习:深层次的神经网络的学习过程。
传统机器学习能完成的任务深度学习都可以完成。
从仿生学的角度,先来看看神经元是如何工作的。
神经元:树突(多个)用来接收信号,细胞体用来处理信息,轴突(一个)用来发送信号,但是目前我们还不知道细胞体怎么处理信息。
人工神经元(感知机)就是类比于人类的神经元提出的。
树突的长短粗细不一样,所以我们的感知机有很多不同的输入和很多不同的权重。
由于计算机是数学计算,所以我们要把感知机抽象为数学。
如何抽象?使用矩阵。将一堆x看为行向量,一堆w看为列向量。
将矩阵相乘,得到X*W=h
最后,让我们来聊聊什么是学习?
学习:以结果为导向,做完这个行为之后你是否掌握了新的技能。
模型得到h的过程称为前向计算(推理过程)
首先,你要能听懂问题,可以自己得到一个答案,然后拿到别人的答案,将别人的答案和自己的答案进行比较再不断调整,这个调整过程就叫学习。
自己得到的结果越错越好,这样代表你的提升空间很大。
总而言之,学习就是发现问题和解决问题的过程。
发现问题(考试):loss=(y-h)2
解决问题(改错):损失越小越好
从w1到w2的过程就是学习
模型根据损失,反向求导,更新w参数的过程称为模型的学习过程。
BP算法:梯度下降+链式法则来更新参数的过程
梯度下降:梯度就是斜率,我们通过计算梯度来确定w的前进方向,以w1为例,通过偏导求出梯度大于0,应该向右移动,但是我们的w2在左边,所以我们还需要给所求的梯度加上一个负号。之后我们再确定步长,如果步长设为1,那么w就会按照对称轴在两个点不断地左右移动,如果步长大于1,那么w就会往上走,所以步长必须小于1。