将博客搬至CSDN
XGBoost使用key-value字典的方式存储参数:params = { 'booster': 'gbtree', 'objective': 'multi:softmax',
先去掉些不要的列。(2)Attrition:员工是否已经离职,数量和部门的关系。薪酬水平与离职率的叠加条形图。注意,对象为object类型,会导致后面运行出错,发现,改变样本和测试集比例会影响分数,——————得到结果。refer灵感:https://www.colabug.com/4055159.htmlone-hot编码——:https://blog.csdn.net/lujiandong1/
离散特征的编码分为两种情况:1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}使用pandas可以很方便的对离散型特征进行one-hot编码>importpandasaspddf=pd.DataFrame([['gree
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号