文章目录
数据集
该数据集包含美国人口普查局收集的美国马萨诸塞州波士顿住房价格的有关信息, 数据集很小,只有506个案例。
CRIM - 城镇人均犯罪率
ZN - 占地面积超过25,000平方英尺的住宅用地比例
INDUS - 每个城镇非零售业务的比例
CHAS - Charles River虚拟变量(如果是河道,则为1;否则为0)
NOX - 一氧化氮浓度(每千万份)
RM - 每间住宅的平均房间数
AGE - 1940年以前建造的自住单位比例
DIS - 加权距离波士顿的五个就业中心
RAD - 径向高速公路的可达性指数
TAX - 每10,000美元的全额物业税率
PTRATIO - 城镇的学生与教师比例
B - 1000(Bk - 0.63)^ 2其中Bk是城镇黑人的比例
LSTAT - 人口状况下降%
MEDV - 自有住房的中位数报价, 单位1000美元
返回顶部
波士顿房价回归预测评估
获取数据集
返回顶部
划分数据集、建模获取建模结果
-
模型.predict(测试集)
对测试集进行回归模型预测 -
模型.coef_
获取回归模型的回归系数 -
模型.intercept_
获取回归模型的截距
返回顶部
可视化
- 通过对真实房价与预测房价的数据可视化对比,可以发现线性回归模型的拟合程度不是十分理想,上下起伏波动较大。
返回顶部
评价回归模型
通过线性回归模型的评估指标对上面模型进行评估,可以看出模型拟合效果不是很理想,还有提升的空间。
返回顶部
★ 注意点
在一定程度上,测试集、训练集的划分对于数据模型及结果都会有一定的影响
。如上图所示,这是在random_state =420
的时候,利用划分的数据集进行的心形回归预测及评估,可以看出,此时的数据集训练的模型较好,R²达到了0.82
,图形拟合度较高。
返回顶部