朴素常见面试题1、 朴素与LR的区别?朴素是生成模型,根据已有样本进行估计学习出先验概率P(Y)和条件概率P(X|Y),进而求出联合分布概率P(XY),最后利用贝叶斯定理求解P(Y|X),而LR是判别模型,根据极大化对数似然函数直接求出条件概率P(Y|X);朴素是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的),而LR则对此没有要求;朴素
作者:钟伟海2016-04-01一、 反垃圾邮件技术介绍   是基于概率的一种算法,是Thomas Bayes:一位伟大的数学大师所创建的,目前此种算法用于过滤垃圾邮件得到了广泛地好评。过滤器是基于“自我学习”的智能技术,能够使自己适应垃圾邮件制造者的新把戏,同时为合法电子邮件提供保护。在智能邮件过滤技术中,(Bayesian)过滤技术取得了较大的成功,被越来越多地应用在反
1. 朴素朴素法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的数据集,首先基于特征条件独立假设学习输入输出的联合概率分布。然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。2. 公式3. 解释先验概率?就是因变量(二分法)在数据集中的比例。这是在你没有任何进一步的信息的时候,是对分类能做出的最接近的猜测。 即P(Y = c_k)4. 解释似然估计?
机器学习你知道法则。机器学习与它有何相关?它可能很难掌握如何把拼图块放在一起——我们了解它花了一段时间。和频率论者在本质上,意味着概率。这个具体的术语存在是因为有两个概率方法。认为这是一个衡量的信念,因此,概率是主观的,并且指向未来。频率论者有不同看法:他们用概率...
转载 2016-06-04 15:58:00
134阅读
2评论
推断及其互联网应用(一):定理简介 这个时候,我正在翻译Paul Graham的《黑客与画家》。 那本书的第八章,写了一个非常具体的技术问题----如何使用推断过滤垃圾邮件(英文版)。 我没完全看懂那一章。当时是硬着头皮,按照字面意思把它译出来的。虽然译文质量还可以,但是心里很不舒服,下决心一定要搞懂它。 一年过去了,我读了一些概率论文献,逐渐发现推断并不难。原理的部分相当容易
参考: 代码段需完善假设这里要被分类的类别有两类,类c1和类c2,那么我们需要计算概率p(c1|x,y)和p(c2|x,y)的大小并进行比较:如果:p(c1|x,y)>p(c2|x,y),则(x,y)属于类c1p(c1|x,y)<p(c2|x,y),则(x,y)属于类c2我们知道p(x,y|c)的条件概率所表示的含义为:已知类别c1条件下,取到点(x,y)的概率;那么p(c1|x,y)
转载 2023-11-29 10:14:59
77阅读
看到一篇既有理论又有实例的博文,清晰易懂地讲解了朴素,将实例转载过来,作为备忘。 下面讨论一个使用朴素分类解决实际问题的例子,为了简单起见,对例子中的数据做了适当的简化。 这个问题是这样的,对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而在一些运营分析报告中避免这些账号的干扰,亦可以加强对SNS
你是一名经验丰富的程序员,但是bug仍然暗藏在你的代码中。实现一个极其困难的算法后,你决定在一个简单的例子上测试自己的代码。过了。然后在一个稍稍困难的问题上进行测试,还是过了。接着这样下去,更加复杂的问题,都过了!你开始相信自己的代码莫有问题了~如果你这样子进行思考,那么祝贺你,你是在如主义者那样进行思考!推断只是简单地在考虑了新的证据后,更新你的信念。主义者很少对于一个结果很
目录决策决策理论公式从条件概率公式推导公式从全概率公式推导公式公式应用决策决策理论  决策理论:在不完全情报下,对部分未知的状态用主观概率估计。公式从条件概率公式推导公式若果\(A\)和\(B\)相互独立,则有\(p(A,B) = p(A)p(B)\),并有条件概率公式\[p(A|B) = {\frac{p(A,B)}{p(B)}}
因为目前来看,最常用的优化方法是基于高斯过程的,所以本篇blog主要记录基于高斯过程的优化方法的使用(不讲理论,不讲理论~)一、贴两个比较关键的基于高斯过程的优化包:我个人更加推荐第一个,实现和修改起来更加的方便。二、关于优化方法,注意最大的一个特点就是对参数的优化,其实它也可以理解为一个搜索问题。所以注意BayesianOptimization的包中的block_xxx&
最近的热播剧《天才基本法》中,提到了很多有趣的数学知识点,比如“亲和数”“巴什博奕”“孔明棋”“七桥问题”等等,让很多观众直呼不明觉厉。其中,最让Mr.Tech感兴趣的是剧中男女主参加数学建模大赛时用到的网络。▲女主使用网络进行算法建模,来预测嫌犯行动轨迹和抓捕时间方位。图片截图自电视剧《天才基本法》网络是一种分类算法,被广泛地应用于医疗诊断、风控等业务场景中,并发挥着重要作用。
1、基本概念(原文地址)在机器学习中,朴素是一个分类模型,输出的预测值是离散值。在讲该模型之前首先有必要先了解贝叶斯定理,以该定理为基础的统计学派在统计学领域占据重要的地位,它是从观察者的角度出发,观察者所掌握的信息量左右了观察者对事件的认知。公式如下:其中,P(B∣A) 是事件 B 在另一个事件 A已经发生条件下的概率,∑AP(B∣A)P(A) 表示A所有可能情况下的概率,现在要来求
朴素分类实例:检测SNS社区中不真实账号 下面讨论一个使用朴素分类解决实际问题的例子,为了简单起见,对例子中的数据做了适当的简化。 这个问题是这样的,对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而
原创 2021-07-23 17:01:31
222阅读
# 网络与机器学习:探索概率推断的世界 网络(Bayesian Network)是用于处理具有不确定性的复杂问题的一种图形模型。它将变量及其相互关系通过有向无环图(DAG)表示,是机器学习和人工智能领域中重要的工具之一。本文将介绍网络的基本概念、工作原理及其在机器学习中的应用,最后通过示例代码来说明其具体实现。 ## 网络的基本概念 网络由节点和边组成。节点表示
# 方法在机器学习中的应用 方法是一种基于贝叶斯定理的统计方法,广泛用于机器学习中的分类任务。对于刚入行的小白来说,了解方法的基本流程,以及如何在 Python 中实现它是非常重要的。接下来,我将向你解释整个流程,并通过示例代码让你了解每一步的实现。 ## 流程概述 下面是实现方法的基本流程: | 步骤 | 描述 |
原创 7月前
77阅读
玩转聊天记录之预测某句话是谁说的上一篇介绍了如何导出微信聊天记录到制作词云的全过程,刚好最近学了朴素的词袋模型,于是,突发奇想,能否用朴素建模来预测:当输入一句话时,判断是我说的还是女票说的。1. 准备工作我和女票的聊天记录Python环境:pandas、jieba、numpy2. python代码实现首先说明一下,这里的朴素是自己实现的,灵活性比较高但是不如调包来的方便。#导入
一、公式概率:二、朴树分类原理基本
原创 2018-06-02 21:23:00
157阅读
一、前述当多个特征属性之间存在着某种相关关系的时候,使用朴素算法就没法解决
原创 2022-12-30 16:48:19
220阅读
描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)。 你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的 ...
转载 2021-10-12 11:32:00
99阅读
2评论
# 公式在机器学习中的应用 ## 引言 在机器学习中,公式是一种常用的概率理论工具。它可以通过已知的先验概率和新的观测数据,来计算更新后的后验概率。这种方法在分类、预测和模式识别等任务中都有广泛应用。本文将介绍公式在机器学习中的应用流程,并给出相应的代码示例和解释。 ## 1. 流程概述 公式在机器学习中的应用一般可以分为以下几个步骤: | 步骤 | 描述 | | -
原创 2023-08-31 10:32:53
104阅读
  • 1
  • 2
  • 3
  • 4
  • 5