机器学习篇：回归与分类的区别

原创

jenslee 2021-07-08 10:16:12 ©著作权

©著作权归作者所有：来自51CTO博客作者jenslee的原创作品，请联系作者获取转载授权，否则将追究法律责任

http://rishy.github.io/ml/2015/07/28/l1-vs-l2-loss/

回归与分类不在于输入值，而在于输出值的不同，回归输出的值是连续的，分类输出的值存在离散的。

明天湿度是回归问题，明天下不下雨是分类。

机器学习篇：回归与分类的区别_机器学习

回归问题

在回归问题中，我们可以预测房价的变化，未来天气湿度变化等连续性输出的问题。

处理回归问题：1.选取训练模型（如线性模型Linear Regression，多项式模型）；2.导入训练集train_set；3.选择合适的学习算法；4.对结果进行预测。

回归模型：

回归问题中的损失函数：

MSE,MAE,Huber平均平滑损失函数

均方误差(MSE，L2损失)是最常用的回归损失函数，计算方法是求预测值与真实值之间距离的平方和:

机器学习篇：回归与分类的区别_机器学习_02

def mse(true, pred):
    return np.sum((true - pred)**2)

MAE:

平均绝对值误差（也称L1损失）

机器学习篇：回归与分类的区别_机器学习_03

def mae(true, pred):
    return np.sum(np.abs(true - pred))

Huber损失：

机器学习篇：回归与分类的区别_机器学习_04

这里超参数delta的选择非常重要，因为这决定了你对与异常点的定义。当残差大于delta，应当采用L1（对较大的异常值不那么敏感）来最小化，而残差小于超参数，则用L2来最小化。

Log-cosh是另一种应用于回归问题中的，且比L2更平滑的的损失函数。它的计算方式是预测误差的双曲余弦的对数。

当我们更关注区间预测而不仅是点预测时，分位数损失函数就很有用。使用最小二乘回归进行区间预测，基于的假设是残差（y-y_hat）是独立变量，且方差保持不变。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯