(1)涉及到的算法 1.监督学习:线性回归,逻辑回归,神经网络,SVM。 线性回归(下面第三行x0(i)其实是1,可以去掉) 逻辑回归 神经网络(写出前向传播即可,反向框架会自动计算) SVM 2.非监督学习:聚类算法(K-mean),降维(PCA) K-mean PCA 3.异常检测 4.推荐系统
原创 2022-06-27 20:01:33
69阅读
17.1大型数据集的学习 首先通过学习曲线判断是否增大数据集有效: 高方差时(交叉验证集误差减去训练集误差大时)增加数据集可以提高系统。下图中左图增加数据集有效,右图无效。 17.2随机梯度下降法 随机梯度下降法是只使用一个样本来迭代,其损失函数为: 迭代过程为: 特点: (1)计算量小,迭代速度快
原创 2022-06-27 20:01:09
86阅读
前言:开启大约二十天的机器学习时光,以吴恩达的机器学习课程为主线同时结合网上其他的资源进行学习,每天对学到的东西在博客上记录下来,以备复习Q1:机器学习的定义?(1)一种机器学习的定义:一个程序被认为能从经验E中学习,解决任务T,达到性能指标度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。(2) 从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直
原创 2022-07-29 17:42:16
138阅读
Q1首先要做什么 本章将在随后的课程中讲误差分析,然后怎样用一个更加系统性非方法,从一堆不同的方法中,选取合适的那一个。 Q2误差分析 构建一个学习算法的推荐方法为: (1)从一个简单的能快速实现的算法开始,实现该算法并用交叉验证集数据测试这个算法; (2)绘制学习曲线,决定是增加更多数据,或者添加
原创 2022-06-27 19:59:20
65阅读
Q1决定下一步该干什么 当系统的效果很差时,你可能考虑到收集更多的样本,也可能: (1)尝试减少特征的数量; (2)尝试获得更多的特征; (3)尝试增加多项式特征; (4)尝试减少正则化程度λ; (5)尝试增加正则化程度λ。 如果做决策将是本章的内容。而不是盲目的选择一种策略。 Q2评估一个假设 将
原创 2022-06-27 21:20:50
140阅读
转摘的,忘记连接了朴素贝叶斯P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B)所以有:P(A|B)=P(B|A)*P(A)/P(B)对于给出的
转载 2022-12-13 17:32:02
54阅读
一、机器学习定义机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。通过训练样本(x,y)获得学习算法,训练出模型,输入x通过模型得到输出y首先,我们需要在计算机中存储历史的数据。接着,我们将这些数据通过机器学习算法进行处理,这个过程在机器学习
原创 2022-12-06 08:47:26
164阅读
1点赞
课程笔记
原创 2022-06-21 11:36:23
113阅读
1点赞
# 实现“机器学习课程资源”教学指南 作为一名经验丰富的开发者,我将教会你如何实现“机器学习课程资源”。首先,我们需要明确整个流程,然后逐步指导你完成每个步骤。 ## 整个流程 ```mermaid journey title 教学资源实现流程 section 了解需求 section 收集数据 section 数据清洗 section 模型训练
Q1动机一:数据压缩 将特征进行降维,如将相关的二维降到一维: 三维变二维: 以此类推把1000维数据降成100维数据。减少内存占用的空间 Q2动机二:数据可视化 如50个维度的数据是无法进行可视化的,使用降维的方法可以使其降到2维,然后进行可视化。 降维的算法只负责减少维度,新产生的特征的意义就必
原创 2022-06-27 21:27:28
124阅读
第1章           DSP 芯片的定点运算 1.数据的溢出:1>溢出分类:上溢(overflow):下溢(underflow)            &n
15.1问题的动机 将正常的样本绘制成图表(假设可以),如下图所示: 当新的测试样本同样绘制到图标上
原创 2022-06-05 01:09:16
87阅读
Q1过拟合的问题 训练集表现良好,测试集表现差。鲁棒性差。以下是两个例子(一个是回归问题,一个是分类问题) 第一个图明显欠拟合,第三个图过度拟合,拟合函数复杂,虽然对于训练集具有很低的代价函数,但是应用到新样本的能力并不高,图二则是两者的均衡。 解决办法: (1)丢弃一些不能帮助我们正确预测的特征。
原创 2022-06-27 19:58:37
96阅读
18.1问题描述和流程图 (1)图像文字识别是从给定的一张图片中识别文字。 (2)流程包括: 1.文字侦测 2.字符切分(现在不需要切分了) 3.字符分类 18.2滑动窗口 在行人检测中,滑动窗口是首先训练一个固定尺寸输入的判断是否有行人的网络,然后在一张图片中裁该尺寸的图片,送入到网络中;然后不断
原创 2022-06-27 19:59:08
67阅读
16.1问题形式化 (1)讲推荐系统的原因主要有以下几点: 1.推荐系统是一个很重要的机器学习的应用,虽然在学术界上占比较低,但是在商业应用中非常的重要,占有很高的优先级。 2.传达机器学习的一个大思想:特性是可以学习而来的,不需要人工去选择。 (2)说明的案例:电影推荐系统 希望创建一个算法来预测
原创 2022-06-27 20:01:22
76阅读
Q1分类问题 回归问题的输出可能是很大的数,而在分类问题中,比如二分类,希望输出的值是0或1,如何将回归输出的值转换成分类的输出0,1成为关键。注意logistics回归又称 逻辑回归,但他是分类问题,而不是回归问题。 Q2假说表示 其中: sigmoid函数 hθ(x)的作用是,对于给定的输入变量
原创 2022-06-27 21:19:26
60阅读
Andrew Ng 《机器学习》 台大林轩田《机器学习基石》《机器学习技法》 0. 数学&机器学习基础 上海交通大学张志华 机器学习导论 统计机器学习 1. 深度学习 cs231n 代码作业: GitHub - MyHumbleSelf/cs231n: Convolutional Neural Networks Assignments CS231n CNNs for Visua
Andrew Ng 《机器学习》台大林轩田《机器学习基石》《机器学习技法》 0. 数学&机器学习基础 上海交通大学张志华 机器学习导论统计机器学习 1. 深度学习 cs231n 代码作业: GitHub - MyHumbleSelf/cs231n: Convolutional Neural Networks Assignments CS231n CNNs for Visual
这是小册子是Andrew NG关于机器学习实操性非常强的指导小册子,大家可以多读读Machine Learning Yearning - NG.pdf中文翻译版https://github.com/xiaqunfeng/machine-learning-yearning...
原创 2022-01-17 14:27:41
112阅读
13.1无监督学习:简介 将没有标签的样本分成不同的集合(簇),这种算法叫做聚类。常用的领域有市场分割、社交网络分析、计算机集群管理、了解星系等。 13.2K-均值算法 (1)K-均值是最普及的聚类算法,是一种迭代算法,假设需要将数据聚类成n个组,这时候首先随机选择K个点,称为聚类中心。 将每个样本
原创 2022-06-27 21:27:05
63阅读
  • 1
  • 2
  • 3
  • 4
  • 5