第一章-机器学习概论引言机器学习( )这一学科诞生于人工智能的中,它是计算机的一种新的能力,不同于通常的任务,例如编写程序实现一个文件管理系统,或许你需要分层的分模块的去实现它,但它总还是可以使用确定的程序逻辑去表达的,机器学习面对的任务通常是需要收集分析大量来自生活(自然、社会)中的数据,换句话说,机器学习就是用数据编程。例如给一张图片,人依据经验能够很快判断出图中是否有一只猫,那么我们能否按照
使用ststsmodels库建立回归模型时,通常会输出模型的很多检验结果,这些结果是用来对模型的好坏进行检验和评价的 statsmodels是一个Python模块,它为许多不同的统计模型的估计,以及进行统计测试和统计数据探索提供类和函数。在线文档位于statsmodels v0.11.1网站1.模型的显著性检验判断建立的模型是否成立,主要是F-检验,在ststsmodels输出结果中,有F-sta
线性回归是利用梳理统计学中的回归分析来确定两种或两种以上变量之间相互依赖的定量关系的一种统计分析方法。线性回归简介线性回归是一种有监督算法,通常被用于响应预测、分类划分。线性回归的针对的是目标变量是区间型变量的问题。 线性回归是描述目标变量Y是如何随着一组自变量X1、X2…的变化而变化的模型。其中Y的变化分为两部分,一部分是系统性变化,也就是由自变量引起的变化;一部分是随机变化,也就是
转载 2024-03-06 16:22:53
139阅读
回归模型评估指标选择、局限、优势一、 是否预测到了正确的数值1.RSS残差平方和2.均方误差MSE(mean squared error)3.均方根误差RMSE(root mean squared error)4.均方对数误差MSLE(Mean squared logarithmic error)5.绝对均值误差MAE(mean absolute error)6.平均绝对百分比误差MAPE(M
1、拟合        拟合是指机器学习模型在训练的过程中,通过更新参数,使得模型不断契合可观测数据(训练集)的过程。欠拟合指的是模型在训练和预测表现都不好,往往由于模型过于简单,如图(a)所示。正常模型指的是模型在训练和预测表现都好,如图 (b)所示。过拟合是指由于模型过于复杂,模型在训练集上的表现很好,但在测试集上
在这篇文章中,我们将看到如何处理回归问题,以及如何通过使用特征转换、特征工程、聚类、增强算法等概念来提高机器学习模型
原创 2024-05-18 19:30:43
202阅读
回归模型评价指标越接近1,表明方程的变量对y的解释能力越强,这个模型
原创 2022-07-18 14:53:23
515阅读
最近再做一些多元回归分析方面的分析,但对于得出的回归模型的好坏不知道如何才判断,于是查找了一下相关的教材书籍,找到了张文彤老师写的《SPSS统计分析高级教程》这本书,里面对于回归模型的优劣评价给出来了几点看法,我在此做了摘录分享一下。当供建立回归模型的自变量有p 个时,仅考虑各因素的主效应,可以建立2^P 个模型(包括仅含常数项的模型)。如果来衡量这些模型的好坏?常用有以下几种标准:1.复相关系数
分类模型:精确率(accuracy)、召回率、精确率、F值、ROC-AUC 回归模型:RMSE、MSE、MAE、SSE、R2、R2-Adjusted精确率(accuracy):正确分类的样本/总预测样本数 Accuracy=(TP+TN)/(TP+TN+FP+FN)召回率:需召回所有真实情况为1的样本,实际按模型召回预测为1且真实的样本 (预测为1且真实的样本/所有真实为1的样本) Recall=
目录一、常用的评价指标1、SSE(误差平方和)2、R-square(决定系数)3、Adjusted R-Square (校正决定系数)二、python中的sklearn. metrics(1) explained_variance_score(解释方差分)(2) Mean absolute error(平均绝对误差)(3)Mean squared error(均方误差
模型对比与性能评估4.4.1 逻辑回归优点训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;适合二分类问题,不需要缩放输入特征;内存资源占用小,只需要存储各个维度的特征值;缺点逻辑回归需要预先处理缺失值和异常值【可参考task3特征工程】;不能用Logistic回归去解决非线性问题,因为Logistic的决策面
转载 2024-07-01 20:05:31
98阅读
  car中的函数相比于R基础提供的评价模型拟合情况,car包中提供了大量函数,大大增强了拟合和评价回归模型的能力函数    目的qqplot()    分位数比较图durbinWatsonTest()对误差自相关性做Durbin-Watson检验crPlots()    成分与残差图 
1. L1和L2范式的区别使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归),即为L1正则化项,指权值向量中各个元素的绝对值之和。 即为L2正则化项指权值向量中各个元素的平方和然后再求平方根。L1范式是对应参数向量绝对值之和 L1范式具有稀疏性L1范式可以用来作为特征选择,并且可解释性较强L2范式是对应参数向量的平方和,再求平方根L2范式
关于作者:饼干同学 0x00 前言: 本篇内容是线性回归系列的第三篇。在《模型之母:简单线性回归&最小二乘法》、《模型之母:简单线性回归&最小二乘法》中我们学习了简单线性回归、最小二乘法,并完成了代码的实现。在结尾,我们抛出了一个问题:在之前的kNN算法(分类问题)中,使用分类准确度来评价算法的好坏,那么回归问题中如何评价好坏呢?本篇内容就是关于回归模型评价,首先介
其中,i是第几个样本,j是第几个特征 其中,alpha是步长(学习率),后边是方向The Data  我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,
Python–线性回归评价指标实现一、项目背景(可不看) 最近在做非线性数据的数据预测,一头雾水,一年不学习,脑袋有问题。还记得上次做的数据是关于一个政务系统的热点问题分类模块,用了机器学习和深度学习啥的,满脸蒙,反正后面就是做完了(好多吐槽)。现在做的是关于供应链模块的需求预测,简单说目前的运作流程是:客户需求–>营业人员经验修正–>客户需求生成。面临问题:客户的需求不能保证准确性,
转载 2024-05-17 23:48:33
36阅读
 模型评价是指对于已经建立的一个或多个模型,根据其模型的类别,使用不同的指标评价其性能优劣的过程。常用的聚类模型评价指标有ARI评价法(兰德系数)、AMI评价法(互信息)、V-measure评分、FMI评价法和轮廓系数等。常用的分类模型评价指标有准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值(F1 Value)、ROC和AUC等。常用的回归模型
在sklearn中包含四种评价尺度,分别为mean_squared_error、mean_absolute_error、explained_variance_score 和 r2_score。1、均方差(mean-squared-error)2、平均绝对值误差(mean_absolute_error)3.可释方差得分(explained_variance_score) ex...
原创 2021-06-29 11:05:11
562阅读
一、 线性回归模型1 简单介绍下线性回归? 答:线性回归属于监督学习模型,它通过建立一个线性模型来预测一个数值型因变量和一个或者多个自变量之间的关系,使预测值和真实值尽可能接近。优点:简单易懂、可解释性强、易于实现和快速训练等。2 线性回归的5大假设是什么? 答: 1) 自变量与因变量存在线性关系。 2) 自变量相互独立:如果一个自变量受到另一个自变量的影响,则会出现多重共线性,导致模型无法准确预
笔记什么是线性回归具体的内容参数计算什么是逻辑回归?(什么问题)具体的内容(怎么解决的?)建立预测函数(线性回归再套一个函数)Sigmoid函数(Logistic函数)损失函数逻辑回归的损失函数优化方法多元分类逻辑回归有什么用?(什么结果)优点缺点模型过拟合过拟合的原因解决办法正则化L1正则项L2正则项模型评估ROC曲线+PR曲线 什么是线性回归线性:两个变量之间的关系是一次函数关系的(如x和y
  • 1
  • 2
  • 3
  • 4
  • 5