向量空间最小二乘法回归

转载

mob64ca14040d22 2024-10-29 21:44:35

文章标签 向量空间最小二乘法回归机器学习算法支持向量机最小二乘 文章分类 机器学习人工智能

支持向量机最初是基于这样的设想：将数据映射到高维空间，并在该空间中构造一个最优的分割超平面，即最大化“安全”间隔。为了使数据点安全地正确地落在超平面的两侧，有如下不等式：

向量空间最小二乘法回归_机器学习

再通过添加违反约束 ξi 修正为：

向量空间最小二乘法回归_机器学习_02

最大化间隔就是最小化 ||w||。对偶凸二次规划（QP）可以得到最优值，就像 MLP 和其他技术一样，不会收敛到一个局部极小值。当研究者都追随着 SVM/凸二次规划的热潮时，有两个问题却未引起关注。第一个问题是如何选择适当的核。具有良好泛化能力的线性可分器需要恰当地度量训练样本及测试样本的相似性：

向量空间最小二乘法回归_最小二乘_03

第二个问题是计算效率。二次规划是可解的，但是在求解许多大规模问题时，CPU 所花费的时间会迅速增长。采用二次规划是因为存在不等式的约束，所以尝试舍弃不等式约束而得到更简单的等式约束是值得的。使用等式约束并对误差进行平方形式的罚分，将能得到类似之前良好的线性等式，可以更快地解决问题，也便于理解。SVM 分类器的最小二乘变体可以通过改写 SVM 中的最小化问题得到：

向量空间最小二乘法回归_最小二乘_04

向量空间最小二乘法回归_最小二乘_05

其实通过 $向量空间最小二乘法回归_支持向量机_06$ ，我们就可以知道调节 $向量空间最小二乘法回归_支持向量机_06$ 的值可以决定，训练的时候，我们是希望最大软间隔大一点，还是希望误差平均项小一点。这对我们的模型有着很大的影响，一般来说合适的软间隔有着很好的泛化能力，而均方误差项小一点，则对训练集有着更好的拟合能留，所以，对于 $向量空间最小二乘法回归_支持向量机_06$ 如何调节，我们要根据具体问题来定。我们可以通过构造如下拉格朗日函数来求解 LS-SVM 的回归量：