# 常规参数booster gbtree 树模型做为基分类器(默认) U进行运算。 scale_pos_weight 正样本权重,在二分类任务,当正负样本比例失衡时,设置正样本权重,模型效果更好。例如,当正负样本比例为1:
转载 2023-05-18 17:08:49
99阅读
SklearnGridSearchCvSklearn_GridSearchCvSklearnG​ridSearchCv# 运行 xgboost安装包示例程序from xgboost import XGBClassifier# 加载LibSVM格式数据模块from sklearn.datasets import load_svmlight_filefrom sklearn.grid_search import GridSearchCVfrom sklearn.metrics import
原创 2021-08-02 14:29:42
897阅读
目的本文使用Pythonsklearn类库,基于对机器学习线性回归算法理论学习,利用sklearn中集成波士顿房价数据,以此来对线性回归理论知识进行一次实践总结。本文不以预测准确率为目的,只是简单对机器学习线性回归等理论知识进行一次实践总结,以此来体验下sklearn类库使用方法。美国波士顿房价数据集是sklearn里面默认数据集,sklearn内置数据集都位于dataset
转载 2024-03-28 09:01:17
0阅读
sklearn模型调优(判断是否过过拟合及选择参数)这篇博客主要介绍两个方面的东西,其实就是两个函数:1. learning_curve():这个函数主要是用来判断(可视化)模型是否过拟合,关于过拟合,就不多说了,具体可以看以前博客:模型选择和改进 2. validation_curve():这个函数主要是用来查看在参数不同取值下模型性能 下面通过代码例子来看下这两个函数: 一、le
1 过拟合:剪枝参数与回归模型调参 dfull = xgb.DMatrix(X,y) param1 = {'silent':True #并非默认 ,'obj':'reg:linear' #并非默认 ,"subsample":1 ,"max_depth":6 ,"eta":0.3 ,"gamma":0
转载 2021-07-04 10:53:00
437阅读
2评论
# -*- coding: utf-8 -*- """ Created on Tue Jul 31 15:09:58 2018 @author: Administrator """ ''' 从字典类型加载特征 类 DictVectorizer 可用于将标准Python字典(dict)对象列表要素数组转换为 scikit-learn 估计器使用 NumPy/SciPy 表示形式。 '''
转载 2024-09-29 08:54:12
24阅读
1 选择弱评估器:重要参数booster for booster in ["gbtree","gblinear","dart"]: reg = XGBR(n_estimators=180 ,learning_rate=0.1 ,random_state=420 ,booster=booster).f
转载 2021-07-04 10:15:00
241阅读
2评论
# -*- coding: utf-8 -*- """ ############################################################################### # 作者:wanglei5205 # 邮箱:wanglei5205@126.com # 代码:://github.com/wanglei5205 # 博客:://cn...
转载 2018-08-22 20:49:00
801阅读
2评论
1. 数据集1.1 特征 共有30个特征。1.2 目标值1.3 数据分布1.3.1 选择前两维特征绘制散点图1.3.2 使用PCA降维到2维,再绘制散点图2. 代码实现2.1 不做数据预处理,直接选择核函数代码;# 划分数据集 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=
聊到深度学习, 大家第一感觉就是很高大上。 就像我们曾经说到机器学习,很多人也是感觉很高大上,但是慢慢接触之后,发现其无非是数学+编程实现,所以从线性回归开始,不断学习,把各种机器学习方法都学习了一遍,并能够通过Pythonsklearn库编程实现。 有很多朋友和我聊到学习深度学习这个事情,我会推荐他们去看一些相关理论算法,从CNN、RNN到LSTM,从各种传统
#使用网格搜索来查找最佳参数组合 from sklearn.model_selection import GridSearchCV param = {"reg_alpha":np.arange(0,5,0.05),"reg_lambda":np.arange(0,2,0.05)} gscv = G
转载 2021-07-04 10:30:00
312阅读
2评论
LGBMModel 模型创建: 参数 boosting_type : string, optional (default='gbdt') 'gbdt', 传统梯度提升决策树。 'dart', Dropouts meet Multiple Additive Regression Trees. 'go
原创 2021-07-30 13:36:38
872阅读
机器学习好伙伴之scikit-learn使用——datasets获得数据集载入sklearn自带datesets利用sklearn函数生成数据应用示例利用sklearn自带datesets进行训练利用sklearn中生成数据进行训练 在上一节课我们说到如何进行训练集和测试集划分,在划分之前,还有一点很重要是载入合适数据集。 scikit-learn自带许多实用数据集,用于测
一、导入必要工具包# 运行 xgboost安装包示例程序from xgboost import XGBClassifier# atasets import load_svmlight_filefrom sklearn.metrics import accuracy_scorefrom matplotlib impor...
原创 2022-09-08 16:49:38
371阅读
sklearnPCA详见–>http://scikit-lea
原创 2022-11-18 16:00:00
156阅读
使用sklearn完成鸢尾花分类任务。相关知识为了完成本关任务,你需要掌握如何使用sklearn提供DecisionTreeClassifier。数据简介鸢尾花数据集是一类多重变量分析数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类哪一类(其中分别用0,1,2代替)。数据集中部分数据与标签如下图所
转载 8月前
36阅读
目录穷举法网格搜索(GridSearchCV)基本语法案例1: 在决策树应用搜索器属性案例2:案例3 嵌套和非嵌套交叉验证区别随机搜索基础语法案例1:基础语法练习案例2:随机搜索与网格搜索比较其它穷举法网格搜索(GridSearchCV)基本语法help(GridSearchCV):class GridSearchCV(BaseSearchCV):Exhaustive search ove
转载 2024-04-29 17:56:06
97阅读
第一章:sklearn总体介绍引言Sklearn (全称 Scikit-Learn) 是基于 Python 语言机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 设计非常好,所有对象接口简单,很适合新手上路。在 Sklearn 里面有六大任务模块:分别是分类、回归、聚类、降维、模型选择和预处理,如下图从其官网截屏。要使用上述六
目录简介 常规使用模式sklearn数据展示sklearn model中常用属性与功能数据标准化交叉验证过拟合问题保存模型小结简介Scikit-learn(sklearn)是机器学习中常用第三方模块,对常用机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clusterin
一、简介为了能够更好学习文本挖掘相关内容,本人准备对机器学习、深度学习等等相关内容都进行一定了解。今天内容是关于机器学习sklearn一些介绍和用法。 相应,由于网上一些内容实在是不咋,所以本人诚挚推荐大家参照sklearn官方文档进行学习。但是官方文档内容对于没有入门小白来说理解起来还是有一些难度。二、sklearn是什么?2.1、sklearn简介sklearn
转载 2023-09-28 00:34:19
90阅读
  • 1
  • 2
  • 3
  • 4
  • 5