热门 最新 精选 话题 上榜
工欲善其事必先利其器!之前我也断断续续给大家发文整理过一些关于数据科学,尤其是机器学习、深度学方面的速查手册!但是,每次分享的都比较是针对某一块的内容,相对来说,还是不够全面。而且,零散的资料也不便于快速收藏和整理!今天,我发现了一份绝佳的、超全的数据科学机器学习手册,内容非常丰富,可以说是很全面了。一起来看一下,绝对有用!整理这套完整的数据科学手册的作者是来自墨西哥的 Favio V
原创 2022-09-23 10:15:06
41阅读
吐血整理!这可能是最全的机器学习工具手册
“AI有道”,”公众号重磅干货,第一时间送达12 月 9 日,一本机器学习新书上线了,它就是《Limitations of Interpretable Machine Learning Methods》,中文译为《可解释机器学习方法的局限性》。书籍简介:这本书主要解释了当前可解释机器学习方法的局限性。这些方法包括部分相关图(PDP)、累积局部效应(ALE)、排列特征重要性、保留一个协变量(LOCO
原创 2022-09-23 10:03:50
34阅读
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
言而喻,恰当...
原创 2022-09-23 10:02:22
21阅读
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)
作者:陈颖祥、杨子晗编译:AI有道项目地址:​​https://github.com/YC-Coder-Chen/feature-engineering-handbook​​本项目将探讨数据预处理部分:介绍了如何利用 scikit-learn 处理静态的连续变量,利用 Category Encoders 处理静态的类别变量以及利用 Featuretools 处理常见的时间序列变量。目录特征工程的数
原创 2022-09-23 09:46:30
76阅读
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(三)
作者:陈颖祥、杨子晗编译:AI有道基于 Jupyter 的特征工程手册:数据预处理的上一篇:​​专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)​​项目地址:​​https://github.com/YC-Coder-Chen/feature-engineering-handbook​​本项目将探讨数据预处理部分:介绍了如何利用 scikit-learn 处理静态的连续变量,利用
原创 2022-09-23 09:44:56
66阅读
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(二)
机器学习是一门理论性和实战性都比较强的技术学科。在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点。算法理论基础不仅包含基本概念、数学基础,也包含了机器学习、深度学习相关。今天给大家推荐一个不错的算法理论基础面试题汇总资源,已开源~首先放上这份开源面试题汇总的地址:​​https://github.com/sladesha/Reflection_Summary​​其作者是
作者 | 我是韩小琦2.1 数据集包含 1000 个样本,其中 500 个正例、 500 个反例,将其划分为包含 70% 样本的训练集和 30% 样本的测试集用于留出法评估,估算有多少种划分方式。答:排列组合问题。 训练/测试集的划分要尽可能保存数据分布一致 那么训练集中应该包括350个正例和350个反例,剩余的作测试集,那么划分方式应该有 种。2.2 数据集包含100个
原创 2022-09-23 09:41:57
381阅读
周志华机器学习课后习题解析【第二章】
机器学习中的数学原理和公式推导还是非常重要的,但知识点较为繁杂,且不易整理!今天推荐一份开源的《机器学习速查手册》,并且制作成了电子版 PDF,方便大家查阅~这份手册最大的特点就是包含许多关于机器学习的经典公式和图表,有助于您快速回忆有关机器学习的知识点。非常适合那些正在准备与机器学习相关的工作面试的人。Frank Dai 是这份手册的作者,他已经将这份机器学习速查手册开源并发布在 GitHub
原创 2022-09-23 09:37:10
179阅读
135 页的《机器学习速查手册》,公式、图表都有,附下载!
作者:陈颖祥、杨子晗编译:AI有道数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。项目地址:​​https://github.com/YC-Coder-Chen/
原创 2022-09-23 09:36:29
240阅读
专栏 | 基于 Jupyter 的特征工程手册:特征选择(五)
别与机器学...
原创 2022-09-23 09:34:02
331阅读
开源!《模式识别与机器学习(PRML)》笔记、代码、NoteBooks 发布
作者 | Peter编辑 |AI有道系列文章:吴恩达《Machine Learning》精炼笔记 1:监督学习与非监督学习吴恩达《Machine Learning》精炼笔记 2:梯度下降...
点击上方“CVer”,选择“置顶公众号”重磅干货,第一时间送达前戏2018年3月26日,CVer第一时间推文:YOLOv3:你一定不能错过2019年3月23日,CVer推文:重磅!YOL...
转载 2022-09-22 16:01:13
495阅读
YOLOv3最全复现代码合集(含PyTorch/TensorFlow和Keras等)
导读在本文中,您将发现Keras和tf.keras之间的区别,包括TensorFlow 2.0中的新增功能。万众期待的TensorFlow 2.0于9月30日正式发布。虽然肯定是值得庆祝...
转载 2022-09-22 16:00:56
196阅读
Keras vs tf.keras: 在TensorFlow 2.0中有什么区别?
1. 写在前面如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,常见的机器学习算法:监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支持向量机,集...
转载 2022-09-22 15:56:14
114阅读
【白话机器学习】算法理论+实战之关联规则
作者:耳东陈东北大学副教授如果你是一名模式识别专业的研究生,又或者你是机器学习爱好者,SVM是一个你避不开的问题。如果你只是有一堆数据需要SVM帮你处理一下,那么无论...
转载 2022-09-22 15:54:36
287阅读
深入浅出—一文看懂支持向量机(SVM)
徐亦达教授在github公布了他的历年机器学习相关课件、视频,黄海广博士协助徐亦达老师对课件目录进行翻译和整理,并提供下载。徐亦达老师简介徐亦达,现任悉尼科技大学教授,UTS全球数据技术...
台湾大学林轩田老师的《机器学习基石》、《机器学习技法》课程由浅入深、内容全面,基本涵盖了机器学习领域的很多方面。其作为机器学习的入门和进阶资料非常适合。本站实现了课程教材的绝大部分习题,...
原创 2022-09-22 15:47:10
100阅读
【本站原创】台大林轩田《机器学习基石》系列课程教材的习题解答和实现
【机器学习炼丹术】的学习笔记分享<<小白学PyTorch>>扩展之Tensorflow2.0 | 20 TF2的eager模式与求导扩展之Tensorflow2....
译者:张峰,Datawhale成员本文将介绍机器学习算法中非常重要的知识—分类(classification),即找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是...
<<小白学PyTorch>>扩展之Tensorflow2.0 | 21 Keras的API详解(上)卷积、激活、初始化、正则扩展之Tensorflow2.0 | ...
要的工具——Validation。我们将整个训练集分成两...
原创 2022-09-22 14:22:29
79阅读
台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles
一、介绍本篇文章,我们将讨论所谓的“维度灾难”,并解释在设计一个分类器时它为何如此重要。在下面几节中我将对这个概念进行直观的解释,并通过一个由于维度灾难导致的过拟合的例子来讲解。考虑这样一个例子,我们有一些图片,每张图片描绘的是小猫或者小狗。我们试图构建一个分类器来自动识别图片中是猫还是狗。要做到这一点,我们首先需要考虑猫、狗的量化特征,这样分类器算法才能利用这些特征对图片进行分类。例如我们可以通
\现在大家平时会遇到很多不错的机器学习资源,但是大多数情况下,资源比较分散,不方便集中管理和查阅。更重要的是往往很难找到一个系统完整的资源导航,形成系统的学习路线,方便搜索。重磅!今天小编在网上“闲逛”的时候发现了一个超级棒的机器学习优质资源分类导航。至少节约大家 50% 的时间。下面详细给大家介绍一下!首先,放上这个机器学习优质资源分类导航的网站:​​https://madewithml.com
原创 2022-09-22 14:16:23
61阅读
一个网站拿下机器学习优质资源!搜索效率提高 50%
作者:陈颖祥、杨子晗编译:AI有道经过数据预处理和特征选择,我们已经生成了一个很好的特征子集。但是有时该子集可能仍然包含过多特征,导致需要花费太多的计算能力用以训练模型。在这种情况下,我们可以使用降维技术进一步压缩特征子集。但这可能会降低模型性能。同时,如果我们没有太多时间进行特征选择,我们也可以在数据预处理之后直接应用降维方法。我们可以使用降维算法来压缩原始特征空间直接生成特征子集。具体来说,我
原创 2022-09-22 14:15:36
90阅读
【完结篇】专栏 | 基于 Jupyter 的特征工程手册:特征降维
作者:陈颖祥、杨子晗编译:AI有道数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。项目地址:​​https://github.com/YC-Coder-Chen/
原创 2022-09-22 14:13:37
171阅读
专栏 | 基于 Jupyter 的特征工程手册:特征选择(四)
作者:陈颖祥、杨子晗编译:AI有道数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行建模。项目地址:​​https://github.com/YC-Coder-Chen/
原创 2022-09-22 14:13:01
352阅读
专栏 | 基于 Jupyter 的特征工程手册:特征选择(三)
作者:陈颖的变量可能是多余...
原创 2022-09-22 14:11:34
156阅读
专栏 | 基于 Jupyter 的特征工程手册:特征选择(二)
,部分新生成的变量可能是多余...
原创 2022-09-22 14:09:53
113阅读
专栏 | 基于 Jupyter 的特征工程手册:特征选择(一)
作者 | 台运鹏几乎每个机器学习从业者都知道回归,其中一些人可能认为这没什么大不了的,只是从参数之间的切 换罢了。本文将阐明每种回归算法的细节,以及确切的区别。包括 :OLSWeighted Least SquaresLassoRidgePolynomial RegressionLogistic regressionSupport Vector RegressionElastic NetBayes
前言本文是模式识别课程关于支持向量机(SVM)算法的课程设计,根据人脸的面部特征,通过SVM算法将表情分为7类。 数据集本文采用的数据集为The Japanese Female Facial Expression (JAFFE) Dataset 数据集来源:​​​https://zenodo.org/record/3451524#.YaeJztBByUl​​ 共有七个类别:anger、disgus
原创 2022-09-22 10:21:11
311阅读