半监督目标检测源码半监督svm

转载

mob6454cc70642f 2024-07-17 10:22:49

文章标签 半监督目标检测源码支持向量机学习机器学习人工智能 文章分类 计算机视觉人工智能

沿着SVM的进化路线，不断改进SVM算法。
TSVM算法的思路是在SVM的外面套了一个搜寻 $半监督目标检测源码半监督svm_支持向量机$ ，有意思的是它将惩罚因子也作为迭代的调整参数。
本文从编程优化的角度讨论了TSVM 算法的来龙去脉，并给出了伪代码。

半监督SVM

我们先看看【西瓜书式】第6章中，SVM的进化路线：最大化间隔【西瓜书式(6.5)】 $半监督目标检测源码半监督svm_机器学习_02$ 最小化 $半监督目标检测源码半监督svm_学习_03$ 【西瓜书式(6.6)】（即SVM基本型） $半监督目标检测源码半监督svm_机器学习_02$ 放开硬控制，不满足约束的样本尽可能少【西瓜书式(6.29)】 $半监督目标检测源码半监督svm_机器学习_02$ 软间隔支持向量机【西瓜书式(6.35)】.

进一步地：若改为分隔线穿过数据的低密度区，则为S3VM【西瓜书图13.3】；若对 $半监督目标检测源码半监督svm_机器学习_06$ 打上预测标记 $半监督目标检测源码半监督svm_半监督目标检测源码_07$ ，则可用 $半监督目标检测源码半监督svm_半监督目标检测源码_07$ 来监督SVM，由此可将【西瓜书式(6.35)】推广到【西瓜书式(13.9)】（将 $半监督目标检测源码半监督svm_机器学习_09$ 改为 $半监督目标检测源码半监督svm_学习_10$ ）即TSVM。

TSVM算法的思路是在SVM的外面套了一个搜寻 $半监督目标检测源码半监督svm_半监督目标检测源码_07$ ，有意思的是它将惩罚因子也作为迭代的调整参数。

TSVM的直接逻辑（如图13.1所示）：

半监督目标检测源码半监督svm_人工智能_12

图13.1 TSVM原理

（1）初始化：用 $半监督目标检测源码半监督svm_机器学习_13$ 训练一个 $半监督目标检测源码半监督svm_半监督目标检测源码_14$ ，用 $半监督目标检测源码半监督svm_半监督目标检测源码_14$ 对 $半监督目标检测源码半监督svm_机器学习_06$ 中样本进行预测，得 $半监督目标检测源码半监督svm_支持向量机_17$ ，初始化两惩罚因子 $半监督目标检测源码半监督svm_支持向量机_18$ 。

（2）循环调整：

（2.1）基于 $半监督目标检测源码半监督svm_人工智能_19$ ，求解【西瓜书式(13.9)】（求解方法见【西瓜书式(6.35)】），得到新的SVM；

（2.2）用新的 $半监督目标检测源码半监督svm_半监督目标检测源码_14$ 重新预测 $半监督目标检测源码半监督svm_机器学习_06$ 中的样本，更新 $半监督目标检测源码半监督svm_支持向量机_17$ ；

（2.3）调大 $半监督目标检测源码半监督svm_学习_23$ ，即 $半监督目标检测源码半监督svm_机器学习_06$ 的作用越来越大；

（2.4）未到结束条件时，返回（2.1）。

然而，（2.2）步重新预测 $半监督目标检测源码半监督svm_学习_25$ 可以改为：根据原 $半监督目标检测源码半监督svm_学习_25$ 与 $半监督目标检测源码半监督svm_支持向量机_27$ 间的不协调性，调整出新的 $半监督目标检测源码半监督svm_学习_25$ （如图13.2 所示）：

半监督目标检测源码半监督svm_机器学习_29

图13.2 TSVM

我们回到【西瓜书式(6.41)】下面的讨论：“ $半监督目标检测源码半监督svm_学习_30$ 若 $半监督目标检测源码半监督svm_半监督目标检测源码_31$ ，则有 $半监督目标检测源码半监督svm_学习_32$ ，此时，若 $半监督目标检测源码半监督svm_学习_33$ 则 $半监督目标检测源码半监督svm_学习_30$ ，若 $半监督目标检测源码半监督svm_机器学习_35$ 则该样本被错误分类”，即：当 $半监督目标检测源码半监督svm_机器学习_35$ 则对该样本的预测可能错误（在前述“该样本被错误分类”的肯定结论中，去掉了部分前提条件，则结论改为“可能”）。

将该结论应用于（2.2）步：当 $半监督目标检测源码半监督svm_机器学习_35$ 时，认为 $半监督目标检测源码半监督svm_学习_25$ 可能错误，调整： $半监督目标检测源码半监督svm_人工智能_39$ ，调整后，再训练，再调整 $半监督目标检测源码半监督svm_学习_30$ ，即

（2.2）的修订

半监督目标检测源码半监督svm_学习_41

当然，细节上还应该考虑避免死循环（后续也一样）。

然而，上述对（2.2）的修订破坏了初始化时得到的 $半监督目标检测源码半监督svm_机器学习_06$ 伪标记 $半监督目标检测源码半监督svm_支持向量机_17$ 中正反例的比例。由于初始化 $半监督目标检测源码半监督svm_机器学习_06$ 伪标记是由有监督学习基于 $半监督目标检测源码半监督svm_机器学习_13$ 训练 $半监督目标检测源码半监督svm_半监督目标检测源码_14$ 来预测得到的，虽然对个体的预测可能不准确，但认为总体上正、反例的比例正确。为了不破坏这个比例关系，应在 $半监督目标检测源码半监督svm_人工智能_47$ 与 $半监督目标检测源码半监督svm_半监督目标检测源码_48$ 之间，配对反号：即一个由正改负，另一个由负改正，式子表示为： $半监督目标检测源码半监督svm_支持向量机_49$ 。

（2.2）的再修订

半监督目标检测源码半监督svm_支持向量机_50

（2.2）定稿

进一步地，有人研究认为：将范围 $半监督目标检测源码半监督svm_半监督目标检测源码_51$ 稍扩大为 $半监督目标检测源码半监督svm_支持向量机_52$ 更好。由此得到TSVM算法【西瓜书图(13.4)】的第6至10行。即

半监督目标检测源码半监督svm_半监督目标检测源码_53

我们以罚参 $半监督目标检测源码半监督svm_学习_23$ 作为停机的控制条件：

第3句：初始化 $半监督目标检测源码半监督svm_支持向量机_55$ ；
第4句：判断是否停机（ $半监督目标检测源码半监督svm_支持向量机_56$ 停机）；
第11句：调整参数（ $半监督目标检测源码半监督svm_半监督目标检测源码_57$ ）。

为解决类别不平衡问题（如，正例远小于反例），修订【西瓜书式(13.9)】，将 $半监督目标检测源码半监督svm_机器学习_06$ 的处罚项分拆为两项

$半监督目标检测源码半监督svm_学习_59$
我们修订罚参 $半监督目标检测源码半监督svm_学习_23$ 的控制条件：

第3句：初始化（ $半监督目标检测源码半监督svm_学习_61$ ），其中， $半监督目标检测源码半监督svm_学习_62$ 与 $半监督目标检测源码半监督svm_半监督目标检测源码_63$ 为对第2句预测结果的统计。
第4句：判断是否停机（ $半监督目标检测源码半监督svm_半监督目标检测源码_64$ 停机）。
第11句：调整参数（ $半监督目标检测源码半监督svm_半监督目标检测源码_65$ ）。