决策树复习
决策树涉及参数
树可视化与Sklearn实例
此处需要安装可视化包graphviz,下载网址:http://www.graphviz.org/Download.php
安装pydotplus,在Anaconda Prompt中输入:pip install pydotplus
scikit-learn是个很强的大机器学习模块。
交叉验证。crossvalidation一般越大越好,一般cv选择5或10。
交叉验证切分的是train set而不是test set。
train set用来建模;
validation set用来在建模过程中在交叉验证时调节参数用的;
test set盖棺定论最后一次评估用。
Sklearn参数选择模块