import csv
from sklearn.ensemble import RandomForestRegressor
from housing import plot_feature_importances
# 读取csv
def load_dataset(filename):
file_reader = csv.reader(open(filename, 'rb'), delimiter=',')
X, y = [], []
for row in file_reader:
X.append(row[2:13])
y.append(row[-1])
# 提取特征名称
feature_names = np.array(X[0])
# 将第一行特征名称移除, 仅保留数值
return np.array(X[1:]).astype(np.float32), np.array(y[1:]).astype(np.float32),feature_namesX, y, feature_names = load_dataset(sys.argv[1])
X, y = shuffle(X, y, random_state=7)num_training = int(0.9 * len(X))
X_train, y_train = X[:num_training], y[:num_training]
X_test, y_test = X[num_training:], y[num_training:]rf_regressor = RandomForestRegressor(n_estimators=1000, max_depth=10,min_samples_split=1)
rf_regressor.fit(X_train, y_train)y_pred = rf_regressor.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
evs = explained_variance_score(y_test, y_pred)
print("\n#### Random Forest regressor performance ####")
print("Mean squared error =", round(mse, 2))
print("Explained variance score =", round(evs, 2))plot_feature_importances(rf_regressor.feature_importances_, 'Random Forest regressor', feature_names)
机器学习-影响单车
原创
©著作权归作者所有:来自51CTO博客作者mb636514f3a19f5的原创作品,请联系作者获取转载授权,否则将追究法律责任
上一篇:机器学习-多项式回归
下一篇:机器学习-岭回归
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
机器学习 共享单车流量预测 共享单车预测模型机器学习 共享单车流量预测 共享单车 流量预测 深度学习 图卷积神经网络
-
java split循环字符串遇到括号
作者:Hollis 本文,也是对于Java中字符串相关知识的一个补充,主要来介绍一下字符串拼接相关的知识。本文基于jdk1.8.0_181。 一、字符串拼接 字符串拼接是我们在Java代码中比较经常要做的事情,就是把多个字符串拼接到一起。我们都知道,String是Java中一个不可变的类,所以他一旦被实例化就无法被修改。不可变类的实例一旦创建,其成员变量的值就不能被修改。这样设
java split循环字符串遇到括号 java 字符串拼接 java 字符串数组 java 数组拼接 java中stringbuffer -
hbase读取速度性能报告
Hbase框架介绍HBase是一个分布式的、面向列的开源数据库。不同点:l 和一般的关系数据库不同,hbase是一个适合于非结构化数据存储的数据库。l Hbase是基于列而不是基于行的模式。 在分布式的生产环境中,HBase 需要运行在 HDFS 之上,以 HDFS 作为其基础的存储设施。HBase上层提供了访问的数据的 Java API 层,供应用访问存储在 H
hbase读取速度性能报告 hbase hbase写数据流程 hbase读数据流程 hbase结构分析