机器学习_51CTO博客

机器学习入门基础：机器学习实践

分机器学习的数据，可以划分为训练集、验证集和测...

机器学习

人工智能

深度学习

算法

数据挖掘

原创精选

机器学习初学者

10月前

628阅读

《机器学习》学习笔记

本文为《机器学习》西瓜书第2、5、9章第学习笔记，与原书第区别在于对关键知识点进行了内容提炼和给出了较为详细的公式推导，针对经典聚类算法，给出了自己的精简复现代码。

泛化

数据集

方差

k-means聚类

反向传播

原创精选

嵌入式视觉

2023-02-20 22:25:06

330阅读

机器学习 -- 分类

1. 朴素贝叶斯贝叶斯决策理论方法是统计模型决策中的一个基本方法，基本思想如下：（1）已知类条件概率密度参数表达式和先验概率（2）利用贝叶斯公式转换成后验概率（3）根据后验概率大小进行决策分类。贝叶斯概率研究的是条件概率，也就是研究的场景是在带有某些前提条件下，或者在某些背景条件的约束下发生的概率问

核函数

字段

样本空间

推荐原创

執孒の掱,與

2022-12-13 09:26:27

380阅读

3点赞

机器学习笔记

在机器学习(Machine learning)领域，监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多，应用比较广的学习技术

机器学习笔记

转载精选

zhangjiazimei

2012-10-09 19:24:45

536阅读

机器学习入门

目录1 机器学习概述2 机器学习过程2.1 机器学习与人类学习3 机器学习的分类3.1 无监督学习3.2 监督学习3.3 深度学习3.4 强化学习4 机器学习应用人工智能，也就是我们每天挂在嘴边的AI，可以被简单地定义为努力将通常由

机器学习

人工智能

big data

数据

深度学习

原创精选

程序员老陆

2022-06-26 01:35:43

393阅读

js玩转机器机器学习

在机器学习中，我们的模型建立完成后，通常要根据评估指标来对模型进行评估，以此来判断模型的可用性。而评估指标主要的目的是让模型在未知数据上的预测能力最好。因此，我们在模型训练之前，要对训练集和测试集进行划分。一般数据集划分的方法有四种：留出法、交叉验证法、留一法、自助法。注：数据集D划分为两个互斥的的集合，其中一个集合作为训练集S，另一个作为测试集T。数据集的具体划分方法1.留出法留出法直接将数

数据集

交叉验证

反例

原创精选

TwcatL_tree

2月前

139阅读

【机器学习】数据科学基础——机器学习基础实践（一）

【机器学习】数据科学基础——机器学习基础实践，基于百度飞桨开发，参考于《机器学习实践》所作。

paddle

python

数据

人工智能

机器学习

推荐原创

灵彧universe

2022-08-14 10:07:18

695阅读

1点赞

【人工智能】机器学习介绍以及机器学习流程

机器学习机器学习（Machine Learning，ML）是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。普遍认为，机器学习的处理系统和算法是主要通过找出数据里隐藏的模式进而做出预测的识别模式，它是人工智能的一个重要子领域。机器学习分类按照训练样

数据

机器学习

数据集

推荐原创

小南蓬幽

2022-08-09 08:26:02

571阅读

1点赞

【机器学习】几种常用的机器学习调参方法

在机器学习中，模型的性能往往受到模型的超参数、数据的质量、特征选择等因素影响。其中，模型的超参数调整是模型优

机器学习

人工智能

搜索

数据集

优化算法

原创精选

TwcatL_tree

4月前

224阅读

个体与集成集成学习的概念：通过构建并结合多个学习期来完成学习任务，通过投票（voting）产生；同质（homogeneous）：多个“基学习器（base learner）”集成的学习器；（个体分类器算法类型相同）异质（heterogenous）：由多个不同类型算法的组件学习器（component learner）集成的学习器；（个体分类器算法类型不同）要点：个体学习器的“准确性”和“多样性”很重要

决策树

数据

损失函数

原创精选

女王de专属领地

10月前

311阅读

机器学习 -- 聚类

1. K-Means 算法此算法是很常用的一个算法，也是基于向量距离来做聚类。算法步骤：（1）从 n 个向量对象任意选择 k 个向量作为初始聚类中心（2）根据在步骤（1）中设置的 k 个向量（中心对象向量），计算每个对象与这 k 个中心对象各自的距离 &nbs

类簇

聚类

样本空间

原创精选

執孒の掱,與

2022-12-10 16:10:52

337阅读

3点赞

机器学习-SVD分解

1. 概念2. 作用把前K个比较大的奇异值保留，其余设为0，得到Σ',由UΣ'VT得到A',其保留了A的主要信息，去掉可能存在的噪声，即不重要的信息。有助于建模，且有可能用其去选择更合适的特征，以及可以应用于隐特征的挖掘。比如：上述公式中U可以表示为用户信息，VT可以表示为商品特征，印刻可以用于商品的推荐。3. 步骤求ATA的特征值和特征向量（可以用QR分解，np.linalg.eig()）特征向

特征向量

特征值

python

原创精选

终黑极客

2021-12-13 21:40:14

755阅读

1点赞

机器学习基础——详解机器学习损失函数之交叉熵

今天这篇文章和大家聊聊机器学习领域的熵。我在看paper的时候发现对于交叉熵的理解又有些遗忘，复习了一下之后，又有了一些新的认识。故写下本文和大家分享。熵这个概念应用非常广泛，我个人认为比较经典的一个应用是在热力学当中，反应一个系统的混乱程度。根据热力学第二定律，一个孤立系统的熵不会减少。比如一盒乒乓球，如果把盒子掀翻了，乒乓球散出来，它的熵增加了。如果要将熵减小，那么必须要对这个系统做功，也就是

Java

原创精选

wx6087db7ed1cb2

2021-04-29 17:19:16

5230阅读

【机器学习】一、机器学习概述与模型的评估、选择

阿瑟.萨缪尔Arthur Samuel,1952年研制了一个具有自学习能力的西洋跳棋程序，1956年应约翰.麦卡锡John McCarthy（人工智能之父）之邀，在标

机器学习

人工智能

数据集

泛化

强化学习

原创精选

TwcatL_tree

4月前

190阅读

机器学习入门总结

清洗标注数据的方法，主要是是数据采样和样本过滤。数据采样：对于分类问题：选取正例，负例。对于回归问题，需要采集数据。对于采样得到的文本，根据需要设定样本权重，当模型不能使用全部的数据来训练时，需要对数据进行采样，设定一定的采样率。采样的方法包括随机采样，固定比例采样等方法。样本过滤：1.结合业务情况进行数据的过滤，例如去除crawler抓取，spam，作弊等数据。 - 2.异常点检测，采用异常点检测算法对样本进行分析，常用的异常点检测算法包括 - 偏差检测，例如聚类，最近邻等。

数据

交叉验证

归一化

原创精选

嵌入式视觉

2023-02-13 00:07:03

321阅读

机器学习算法：AdaBoost

AdaBoost算法（Adaptive Boost）的核心思想是：如果一个弱分类器的分类效果不好，那么就构建多个弱分类器，综合考虑它们的分类结果和权重来决定最终的分类结果。很多人认为AdaBoost是监督学习中最强大的两种算法之一（另一个是支持向量机SVM）。AdaBoost的训练过程如下：为每个训练样本初始化相同的权重；针对训练样本及权重，找到一个弱分类器；计算出这个弱分类器的错误率ε与权重α；

机器学习

推荐原创

BoyTNT

2014-11-06 10:20:42

5381阅读

1点赞

2评论

机器学习-逻辑回归

逻辑回归：解决分类问题逻辑回归既可以看做是回归算法，也可以看做是分类算法通常作为分类算法用，只可以解决二分类问题代码实现实现逻辑回归加载数据使用逻辑回归。

机器学习

逻辑回归

人工智能

hg

数据集

原创精选

小旺v

2月前

120阅读

机器学习技术系列：【机器学习工程化平台 Kubeflow】简介

导言如今，很多科技企业都投入了对机器学习技术的研究和应用中。但是面临的情况可能是组织已经在本地使用机器学习，但还不能够将其部署到生产环境中；或者能够部署模型，但无法对其进行有效管理。在这种情况下，最有价值的技能不是训练模型，而是管理模型，并以让它们产生最大影响的方式部署它们。了解模型开发生命周期通常机器学习或模型开发遵循以下路径：数据→信息→知识→洞察力。这种从数据中产生洞察力的方式可以用下图来形

机器学习

MLops

原创精选

一个叫大姚的工程师

2023-02-20 19:28:59

1488阅读

深度学习之二【机器学习介绍】

人从过去经验中学习；机器从过往数据中学习。回归模型是一个预测值的模型

深度学习

机器学习

ROC曲线

评估指标

F1得分

原创精选

Johnny_Cheung

2023-04-09 20:35:27

278阅读

【机器学习】特征选择与稀疏学习

特征选择和稀疏学习子集搜索与评价对象都有很多属性来描述，属性也称为特征（feature），用于刻画对象的某一个特性。对一个学习任务而言，有些属性是关键有用的，而有些属性则可能不必要纳入训练数据。对当前学习任务有用的属性称为相关特征（relevant feature）、无用的属性称为无关特征（irrelevantfeature）。从给定的特征集合中选择出相关特征子集的过程，称为特征选择（featur

特征选择

数据集

搜索

原创精选

TwcatL_tree

3月前

697阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

机器学习

机器学习入门基础：机器学习实践

《机器学习》学习笔记

机器学习 -- 分类

机器学习笔记

机器学习入门

js玩转机器机器学习

【机器学习】数据科学基础——机器学习基础实践（一）

【人工智能】机器学习介绍以及机器学习流程

【机器学习】几种常用的机器学习调参方法

机器学习.周志华《8 集成学习》

机器学习 -- 聚类

机器学习-SVD分解

机器学习基础——详解机器学习损失函数之交叉熵

【机器学习】一、机器学习概述与模型的评估、选择

机器学习入门总结

机器学习算法：AdaBoost

机器学习-逻辑回归

机器学习技术系列：【机器学习工程化平台 Kubeflow】简介

深度学习之二【机器学习介绍】

【机器学习】特征选择与稀疏学习

机器学习的开源工具

机器学习知识图谱

机器学习算法之BIRCH

机器学习-特征选择-PCA

机器学习特征降维

浅出深入-机器学习

机器学习经典算法总结

Python机器学习框架介绍

机器学习-梯度下降法

机器学习-模型评估优化

51CTO博客

机器学习

机器学习入门基础：机器学习实践

《机器学习》学习笔记

机器学习 -- 分类

机器学习笔记

机器学习入门

js玩转机器机器学习

【机器学习】数据科学基础——机器学习基础实践（一）

【人工智能】机器学习介绍以及机器学习流程

【机器学习】几种常用的机器学习调参方法

机器学习.周志华《8 集成学习》

机器学习 -- 聚类

机器学习-SVD分解

机器学习基础——详解机器学习损失函数之交叉熵

【机器学习】一、机器学习概述与模型的评估、选择

机器学习入门总结

机器学习算法：AdaBoost

机器学习-逻辑回归

机器学习技术系列：【机器学习工程化平台 Kubeflow】简介

深度学习 之二 【机器学习介绍】

【机器学习】特征选择与稀疏学习

机器学习的开源工具

机器学习知识图谱

机器学习算法之BIRCH

机器学习-特征选择-PCA

机器学习特征降维

浅出深入-机器学习

机器学习经典算法总结

Python机器学习框架介绍

机器学习-梯度下降法

机器学习-模型评估优化

深度学习之二【机器学习介绍】