基于信息增益进行特征选择python

关注 mob6454cc6328d1

文章目录

1. 熵：(entropy)：
2. 信息增益：

基于信息增益进行特征选择python

转载

mob6454cc6328d1 2024-07-09 22:06:26

文章标签 基于信息增益进行特征选择python 决策树算法机器学习信息增益 文章分类 Python 后端开发

信息增益在决策树的特征选择中很重要，可以说是特征选择的核心方法之一，也同样是决策树生成的核心之一。决策树的算法很多都是建立在信息增益进行的，信息增益是建立在熵这个概念上进行的。熵就是衡量一个变量不确定性的度量。熵用的很广，在信息领域、在强化学习、在统计学习中都用的很广。下面我将分别介绍上述提到的概念：

1. 熵：(entropy)：

信息量大小的度量，即表示随机变量不确定性的度量。熵越大，随机变量的不确定性越大。

基于信息增益进行特征选择python_决策树

基于信息增益进行特征选择python_算法_02

基于信息增益进行特征选择python_信息增益_03

2. 信息增益：

通俗的理解是：一个变量的熵减去其条件熵，得到的值就是这个条件的信息增益。其中，条件熵H(Y|X)：表示在己知随机变量X的条件下随机变量Y的不确定性，定义为X给定条件下Y的条件概率分布的熵对X的数学期望。

基于信息增益进行特征选择python_算法_04

(信息增益):特征A对训练数据集D的信息增益，g(D,A), 定义为集合D的经验熵H(D)与特征A给定条件下

D的经验条件熵H(D|A)之差，即:

基于信息增益进行特征选择python_决策树_05

(Information gain)表示得知特征X的信息而使得类Y的信息的不确定性减少的程度。

—般地，熵H(Y)与条件熵H(Y|X)之差称为互信息（ mutual information)。

基于信息增益进行特征选择python_基于信息增益进行特征选择python_06

基于信息增益进行特征选择python_决策树_07

注：本文的内容只是自己学习过程的一个总结，根据自己的学习感悟进行总结，以便自己日后好复习巩固，如有不对之处，敬请谅解，感谢李航老师的书籍和袁春老师的课件，让我学习到很多知识。

参考文献：

统计学习方法 [M]. 李航，
统计学习方法课件，袁春.

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：高通modem基地址配置

下一篇：微信小程序怎么打开云服务器

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册