感知机

感知机模型

用于处理二元线性可分的数据。在二维平面中,即寻找一条直线能将二元数据分隔开。推广到更一般的n维空间中,即寻找n-1维的超平面,将二元数据分隔开。

数学表示:假设有m个样本,每个样本是n维特征。则目标超平面的表达是​​????0+????1????1+...+???????????????? = 0​​, ????i就是要寻找的参数。这样根据超平面的性质,二元数据可以分成大于0和小于0的两部分,分布在超平面两侧。

为了简化表达式,引入x0 = 1,则上式可写成????∙????。感知机的模型最终定义为​​???? = ????????????????(????∙????)​

感知机损失函数

假设​​????∙???? > 0​​的样本类别输出为1,​​????∙???? < 0​​的样本类别输出为-1.则​​????∙????∙???? > 0​​的分类正确,​​????∙????∙????​​分类错误。损失函数就是误分类的样本到超平面的距离之和。

损失函数的优化方法

采用梯度下降法。

【笔记】感知机模型_数据