机器学习常用基本概念:过拟合、欠拟合、交叉验证、监督学习
1. 机器学习 明白一些基本概念 什么是机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能通俗来讲,让代码学着干活 特征:自变量标签:因变量 学习的种类有监督学习:提供标签,分类、回归无监督学习:无标签,聚类增强学习:也称强化学习,马尔科夫决策过程(Markov Decision Proc
原创 2021-07-23 09:32:22
470阅读
本文首先介绍机器学习基本流程,然后针对机器学习涉及的数据、算法和评估这三个方面用到的基础概念进行介绍。1.场景解析:就是先把整个业务逻辑想清楚,把自己的业务场景进行...
原创 2018-09-21 22:26:40
95阅读
Machine Learing ≈ Looking for a function 机器学习机器学习研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。 任务分类 回归任务:函数的输出是一个标量。 分类任务:给的类别,函数的输出是这些类别之一。 步骤 1、定义含未知参数的函数 ...
转载 2021-09-02 17:26:00
119阅读
2评论
基本概念课程任务机器学习的步骤1. Function with Unknown Parameters2. Define Loss fr
原创 2022-08-07 00:07:25
96阅读
2.1经验误差与过拟合 错误率(error rate) 分类错误的样本数目占样本总数的比例 精度(accuracy) 分类正确的样本数目占样本总数的比例;精度=1-错误率 误差(error) 学习器实际预测输出与样本的真实输出之间的差异 训练误差(training error)/经验误差(empir ...
转载 2021-07-28 15:28:00
130阅读
2评论
1.1引言 机器学习所研究的主要内容 关于在计算机上从数据中产生“模型”(学习器)的算法,即“学习算法” 机器学习是研究关于“学习算法”的学问 1.2基本术语 学得模型前 数据集(data set) 一组记录的集合 示例(instance)/样本(sample) 数据集中每条关于一个事件或对象的描述 ...
转载 2021-07-28 15:27:00
160阅读
2评论
模型容量是指模型拟合各种函数的能力,决定了模型是欠拟合还是过拟合。 欠拟合就是指模型的训练误差过大,即偏差过大,表现为模型不够”准“,优化算法目的在于解决欠拟合问题。 过拟合就是指训练误差和测试误差间距过大,即方差过大,表现为模型不够”稳“,正则化目的在于解决过拟合问题。 机器学习模型的目的是解决欠拟合和过拟合的问题,这也是机器学习算法的两个挑战。
推荐 原创 2023-02-08 17:17:36
375阅读
模型容量是指模型拟合各种函数的能力,决定了模型是欠拟合还是过拟合。 欠拟合就是指模型的训练误差过
机器学习基本概念:(定义)1.机器学习:从数据中寻找有价值的模式(操作)          通过学习表现更好的行为(操作) 2.属性列表法:属性的组合,对应结果 3.决策列 decision list : 属性组合对应结果明确结果(可以减少决策判断次数,如下雨yes,玩no。之后的条件就无需判断),有上下文。 4.决策
原创 2023-04-20 16:52:19
91阅读
1.2.1基本概念训练集测试集特征值监督学习非监督学习半监督学习分类回归1.2.2例子1针对例子1,我们可以把100天的数据(包括每
原创 2022-07-14 18:19:28
139阅读
根据李宏毅老师机器学习课程所做的笔记。 函数y=wx+b,输入与输出之间是一个线性的关系。改变w可以改变直线的斜率,改变b可以改变直线的截距。 但是如果想要刻画上图中的红色直线是困难的。这条红色的曲线应该怎么表示呢? 红色的曲线可以表示为图中蓝色曲线的和。 蓝色曲线(Hard Sigmoid)的特征 ...
转载 2021-09-03 20:52:00
419阅读
2评论
术语理解示例:        对应着数据中的一条记录(多条记录构成数据集)。可以包含标记,也可以不包含标记。    假设一条记录有多个属性构成的,则这条记录就有5维。多个属性构成的空间叫做属性空间,样本空间(示例也可以叫做样本)或者输入空间。每个属性都有多个属性取值,则每条记录都
原创 2017-05-28 10:42:00
920阅读
教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件。内容总结KDDKnowledge Discovery in Databases(KDD)的五大阶段:数据选择(创造数据仓库,选择数据文件)数据预处理(去多余变量,去异常值,处理缺失值)转换(变量值转换为需要的格式)数据挖掘(机器学习部分)验证及
原创 2022-07-18 12:51:13
55阅读
好记性不如烂笔头,打算以博客连载的方式把最近机器学习的一些学习笔记记下来,机器学习涉及的知识点很多,时间一长很容易遗忘,写在博客上也方便自己随时查阅及复习。学习笔记偏重实用工程,尽量不涉及复杂的数学推导。机器学习分类 --监督学习:训练数据中带有标记(分类、回归); --无监督学习:训练数据中无标记(聚类、异常检测、密度分析); --半监督学...
原创 2021-05-25 09:59:03
398阅读
最近一直在接触时间序列,所以打算写一些有关时间序列的文章,预测部分会从规则
图就是一组相互连接的对象。一个图有一组结点N和边E, n是顶点的数目,m是边的数目。连接的两个节点被定义为相邻(节点1相邻或邻
序言:近期主要帮同事讲解《
目录什么是机器学习数据来源与类型数据特征工程数据特征抽取TF-IDFTfidfVectorizer语法数据的特征处理归一化归一化总结标准化结合归一化来谈标准化StandardScaler语法标准化总结缺失值处理方法Imputer流程关于np.nan(np.NaN)...
原创 2021-08-17 17:15:26
327阅读
机器学习基础(一)机器学习机器学习基础(一)1 基本概念1.1 ML各种常见算法图示1.2 导数的计算1.3 关于局部最优和全局最优的描述1.4 大数
  • 1
  • 2
  • 3
  • 4
  • 5