感知机
感知机模型
用于处理二元线性可分的数据。在二维平面中,即寻找一条直线能将二元数据分隔开。推广到更一般的n维空间中,即寻找n-1维的超平面,将二元数据分隔开。
数学表示:假设有m个样本,每个样本是n维特征。则目标超平面的表达是????0+????1????1+...+???????????????? = 0
, ????i就是要寻找的参数。这样根据超平面的性质,二元数据可以分成大于0和小于0的两部分,分布在超平面两侧。
为了简化表达式,引入x0 = 1,则上式可写成????∙????。感知机的模型最终定义为???? = ????????????????(????∙????)
感知机损失函数
假设????∙???? > 0
的样本类别输出为1,????∙???? < 0
的样本类别输出为-1.则????∙????∙???? > 0
的分类正确,????∙????∙????
分类错误。损失函数就是误分类的样本到超平面的距离之和。
损失函数的优化方法
采用梯度下降法。