最近这段时间学习了机器学习中的线性模型,用自己定义的最小二乘法函数和sklearn中的linear_model方法完成了几个小实例,具体就是通过我们班同学的各科成绩来预测最后的平均绩点模型,但不清楚sklearn库中的源码就直接调用都有点不好意思了~~在这里主要还是想记录一下我对于LinearRegre
转载
2024-03-20 07:09:58
67阅读
SMOTE在处理样本不均衡问题时,一种常用的方法是使用“自动重采样”方法。这种方法通过在训练数据中多次重复某些样本来平衡样本数量。具体来说,假设你正在使用 scikit-learn,你可以使用 imblearn 库中的 SMOTE 类来解决这个问题。下面是一个使用 SMOTE 类进行自动重采样的简单示例:# 首先,导入所需的库
from sklearn.datasets import make_c
转载
2024-03-29 20:20:15
100阅读
一、支持向量机SVC:主要调节参数:C、kernel、degree、gamma、coef0。7,8,9一般不考虑。 l, C:C-SVC的惩罚参数C,默认值1.0,C值大,对误分类的惩罚大,趋向于训练集全分对的情况,准确率高,泛化能力弱。C值小,惩罚小,允许容错,泛化能力强。 2, kernel :核函数,默认rbf,可选‘linear’, ‘
转载
2024-04-03 12:56:23
143阅读
机器学习总结-sklearn参数解释实验数据集选取:1分类数据选取 load_iris 鸢尾花数据集from sklearn.datasets import load_iris
data = load_iris()
data.data[[10, 25, 50]]
data.target[[10, 25, 50]]
list(data.target_names)
list(data.fe
1、sklearn数据集1.1 数据集划分机器学习一般的数据集会划分为两个部分 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用来评估模型是否有效1.1.1 sklearn数据集划分APIsklearn.model_selection.train_test_split功能将数组或矩阵拆分为随机的训练子集和测试子集 。输入和输出输入:1、arrays: 具有相同长度的可索引序列,x-y的
一、机器学习模型上线两种方式机器学习模型上线主要分为两种方式,一种是基于HTTP服务方式,这种方式需要在生产环境上部署相应的python环境以及相应的python机器学习包,这种方式好处在于将数据预处理部分和模型部分(保存成pkl文件)都能一起部署在HTTP服务中,缺点则是需要在生产上部署相应的python环境;而另一种方式则是通过PMML方式将机器学习模型打包给java环境使用,这种方法好处在于
转载
2024-03-17 15:33:01
29阅读
SKlearn 深度学习Sklearn简述决策树1、概述1.1 基本概念和解决问题1.2 sklearn 中决策树2. DecisionTreeClassifier 分类树2.1 重要参数2.1.1 criterion2.1.2 建立树: Sklearn简述scikit-learn , 又写作 sklearn ,是一个开源的基于python语言的机器学习工具包,它通过 NumPy, SciOy 和
转载
2024-04-08 09:56:36
38阅读
Sklearn分为6大模块线性算法、回归算法、聚类算法、降维算法、模型选择、预处理
sklearn所有的建模流程都符合以下的步骤
1、导入并建立自己想要的模型
2、把数据导入模型当中训练成自己想要的样子
3、把测试数据导入训练好的模型来预测或者得到答案本页只提及以下算法1、决策树之分类树:DecisionTreeRegressor:监督学习
2、逻辑回归之基础回归算法:LogisticRegres
转载
2024-08-12 17:52:42
19阅读
python实现sklearn的基本操作流程,sklearn预处理方法,sklearn基础算法的使用,以及sklearn模型的选择方法。一、数据的获取与分析1.读取数据2.分析数据二、数据的预处理如果目标字段为数字型StandardScaler()MinMaxScaler()VarianceThreshold()如果目标字段为文本字段TfidfVectorizer()CountVectorize
转载
2024-03-31 10:52:06
124阅读
一、pycharm设置1.实用插件:1)rainbow brackets:彩色括号 2)material theme UI:外观主题 3)idea vim:vim风格编辑器 4)中文语言包 5)csv:轻量csv文件编辑器 6)Translation:中文翻译2.启动故障:pycharmjava.util.concurrent.CompletionException: java.net.BindE
转载
2024-05-24 11:18:21
33阅读
目录1.决策树2.ID3算法3.C4.5算法ID3/C4.5的防过拟合ID3/C4.5的缺失数据4.CART算法1)cart在分类方面:基于基尼系数:Gini(D)2)cart在回归方面:基于方差/标准差CART的剪枝sklearn实现:分类DecisionTreeClassifier回归DecisionTreeRegressor 1.决策树1.1定义Ck表示第k个类,特征T可取n个不同
转载
2024-06-28 10:57:29
83阅读
sklearn.model_selection.learning_curveSee examples/model_selection/plot_learning_curve.py 用学习曲线 learning curve 来判别过拟合问题 本文结构:学习曲线是什么?怎么解读?怎么画? 学习曲线是什么? 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型
转载
2024-08-13 13:15:55
51阅读
学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) ——非监督学习(2)线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习(3)核主成分分
转载
2024-04-22 10:22:55
75阅读
提纲1 简介2 模型架构3 实验设计 3.1 损失函数 3.2 预训练任务 3.3 Efficient retriever fine-tuning4 实验结论5 分析 5.1 可解释性  
# Python sklearn LDA如何可视化
## 介绍
线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的有监督降维算法,它主要用于特征提取和数据可视化。它通过将数据投影到低维空间中的齐次超平面上,最大化不同类别之间的距离,同时最小化同一类别内部的方差,从而实现数据的降维和分类。
在本文中,我们将探讨如何使用Python的scikit-l
原创
2023-09-14 10:23:48
420阅读
1.LDA主题模型困惑度 这部分参照:LDA主题模型评估方法–Perplexity,不过后面发现这篇文章Perplexity(困惑度)感觉写的更好一点,两篇都是翻译的维基百科。 perplexity是一种信息理论的测量方法,b的perplexity值定义为基于b的熵的能量(b可以是一个概率分布,或者概率模型),通常用于概率模型的比较 wiki上列举了三种perplex
转载
2023-12-28 11:11:10
143阅读
成功解决ModuleNotFoundError: No module named 'sklearn.lda'目录解决问题解决思路解决方法第一步,查看sklearn版本第二步,修改代码解决问题ModuleNotFoundError: No module named 'sklearn.lda'解决思路找不到模块错误:没有名为''sklearn.lda'模块解决方法版本更新问题,sklearn0.16...
原创
2021-06-16 21:58:54
6973阅读
成功解决ModuleNotFoundError: No module named 'sklearn.lda'目录解决问题解决思路解决方法第一步,查看sklearn版本第二步,修改代码解决问题ModuleNotFoundError: No module named 'sklearn.lda'解决思路找不到模块错误
原创
2022-02-10 15:06:44
445阅读
class sklearn.linear_model.LinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1)线性回归作为一种最简单,但却是最常用的方法。参数:fit_intercept:说明:是否对训练数据进行中心化,即是否需要b值,若果为False,则不需要。normalize说明:是否对数据进行归一化处
目录LDA主题模型1.LDA主题模型原理2.LDA主题模型推演过程3.sklearn实现LDA主题模型(实战)3.1数据集介绍3.2导入数据3.3分词处理 3.4
原创
2024-05-24 10:33:18
0阅读