分类一般分为两种: 积极学习法:先根据训练集构造模型,然后根据模型对测试集分类 消极学习法:推迟建模,先简单存储训练集,等到给定测试集时再进行建模,如KNN算法。1. 简述 KNN的核心思想就是:物以类聚,人以群分 即给定一个训练数据集,对于新的输入实例,在训练集中找到与该实例最邻近的K个实例,这K个实例多数属于某个类,就把该输入实例分为这个类2. K值的选择 若K值较小,相当于用较小邻
KNN算法的描述:(1)计算测试数据与各个训练数据之间的距离;(2)按照距离的递增关系进行排序;(3)选取
原创
2022-07-18 15:11:57
294阅读
思想(这个只有输出层的神经网络也有用到):在Logistic回归中,1、首先介绍Sigmoid函数: 可以看到它的值域(0,1),通过sigma函数计算出最终结果,以0.5为分界线,最终结果大于0.5则属于正类(类别值为1),反之属于负类(类别值为0)。2、将Sigmoid函数g(z)作为阀门,令Z=WT X,此时这里的大写符号都是向量,
1.hdfs的优缺点 (1)不适合大量小文件存储; (2)不适合并发写入,不支持文件随机修改;(只能append追加) (3)不支持随机读等低延时的访问方式 2.基本思想 主从结构 主节点, namenode 从节点,有很多个: datanodenamenode负责: 接收用户操作请求 维护文件系统
原创
2021-07-15 14:36:14
166阅读
K-近邻算法一、算法概述(1)采用测量不同特征值之间的距离方法进行分类优点: 精度高、对异常值不敏感、无数据输入假定。缺点: 计算复杂度高、空间复杂度高。(2)KNN模型的三个要素kNN算法模型实际上就是对特征空间的的划分。模型有三个基本要素:距离度量、K值的选择和分类决策规则的决定。距离度量距离定义为:一般使用欧式距离:p = 2的个情况K值的选择一般根据经验选择,需要多次选择对比才可以
http://blog.sina.com.cn/s/blog_67fcf49e0101g1lt.html
转载
2023-01-31 07:17:47
295阅读
David Berlinkshi说:有两种思想,象珠宝商放在天鹅绒上的宝石一样熠熠发光,一是微积分,另一个就是算法。如果说微积分及在其基础上建立的数学分析体系造就了现代科学,而算法则造就了现代世界。
算法是计算机科学的灵魂,更是每个程序员和软件工程师必需具有的核心知识。区分一个好的软件工程师和一个代码磨工(coder)的关键就在于看其是否能够分析并设计出高效率的算法。正如爱因斯坦所说的,并非
转载
2021-07-26 15:27:49
166阅读
层次聚类(hierarchical clustering)试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集的划分可采用"自底向上"的聚合策略(AGNES),也可采用"自顶向下"(DIANA) 的分拆策略。1、AGNES算法简介AGNES 是一种采用自底向上聚合策略的算法。它先将数据集中的每个样本看作一个初始聚类簇,然后在算法运行的每一步中找出距离最近的两个聚类簇进行合并,该过程不断重
IOC/DI的基本思想1.把程序之间的依赖关系去掉2.把程序对象设置到IOC/DI容器的配置中作为Bean3.由IOC/D。容器来管理Bean的创建和实例化4.由IOC/DI容器来把Bean之间的关系注入到须要这些关系的对象里面
转载
2015-03-23 10:04:00
82阅读
回溯法又称试探法。回溯法的基本做法是深度优先搜索,是一种组织得井井有条的、能避免不必要重复搜索的穷举式搜索算法。回溯算法的基本思想是:从一条路往前走,能进则进,不能进则退回来,换一条路再试。当我们遇到某一类问题时,它的问题可以分解,但是又不能得出明确的动态规划或是递归解法,此时可以考虑用回溯法解决此
原创
2022-05-27 22:45:55
1113阅读
面向对象: 1、面向对象 EveryThing Is Object。 面向对象是一种程序设计思想,计算机程序的设计实质上就是将现实中的一些事物的特征抽离出来描述成一些计算机事件的过程,这种抽象的过程中,我们把具体的事物封装成一个一个的整体进行描述,使被描述的对象具备一些系统性、整体性的的行为和特征,我们把这种设计思想称为面向对象。 2、面向对象与面向过程 2.1、面向过程是早期的程序语言设
面向对象思想是java的核心思想。它不仅仅应用于编程。它更有利于解决自己身边的种种问题,,,不扯淡,直入正题。面向对象思想是根据和符合于客观事实的;所以理解面向对象思想,就应了解它的客观本质。面向对象的基本哲学是认为世界是由各种各样具有自己的运动规律和内部状态的对象所组成的;不同对象之间的相互作用和通讯构成了完整的现实世界。因此,人们应当按照现实世界这个本来面貌来理解世界,直接通过对象及其相互关系
David Berlinkshi说:有两种思想,象珠宝商放在天鹅绒上的宝石一样熠熠发光,一是微积分,另一个就是算法。如果说微积分及在其基础上建立的数学分析体系造就了现代科学,而算法则造就了现代世界。算法是计算机科学的灵魂,更是每个程序员和软件工程师必需具有的核心知识。区分一个好的软件工程师和一个代码磨工(coder)的关键就在于看其是否能够分析并设计出高效率的算法。正如爱因斯坦所说的,并非所有
转载
2022-04-06 11:32:18
224阅读
1.kNN算法的优缺点优点简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归;可用于数值型数据和离散型数据;训练时间复杂度为O(n);无数据输入假定;对异常值不敏感。缺点:计算复杂性高;空间复杂性高;样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少);一般数值很大的时候不用这个,计算量太大。但是单个样本又不能太少,否则容易发生误分。最大的缺点是无法给出数据的内在含
原创
2021-05-07 17:17:15
3155阅读
动态规划与贪心策略类似,将一个问题的解决方案视为一系列决策的结果。不同的是,贪心算法每采用一次贪心选择便做出一个不可撤回的决策,而在动态规划中,还要考察每个最优决策序列中是否包含一个最优决策自序列。使用动态规划时,所求问题应具有以下两种性质。 1.最优子结构性质 所求问题的最优子结构性质是采用动态规划算法的条件之一,这种性质又被称为最优化原理。动态规划方法采用最优化原理来建立用于计算最优解的递归式。所谓最优化原理即不管前面的策略如何,此后的决策必须是基于当前状态(由上一次决策产生)的最优决策。由于对于有些问题的某些递归式来说并不一定能保证最优原则,因此在求解问题时有必要对它进行验证。若不...
转载
2012-04-19 23:04:00
125阅读
2评论
1.kNN算法的优缺点优点简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归;可用于数值型数据和离散型数据;训练时间复杂度为O(n);无数据输入假定;对异常值不敏感。缺点:计算复杂性高;空间复杂性高;样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少);一般数值很大的时候不用这个,计算量太大。但是单个样本又不能太少,否则容易发生误分。
原创
2022-03-20 16:13:11
2667阅读
理解面向对象需要做的事 java面向对象思想的核心是多态。多态机制也叫动态绑定机制。理解这些概念和核心思想比较好的方式就是画内存图。把一个多态例子程序的执行过程,在纸上画出来,那么就相对有一个较好的理解了。分析问题三步走:第一,思考这个问题应该有哪些类,哪些对象。第二,思考这些类,这些对象中的应该有什么属性和方法。第三,思考类和类之间应该存在什么样的关系。那么类之间有什么样的
Java中的方法调用中参数传递有两种,一个是对于参数是基本类型的使用的是值传递(直接传参数的值),另一个是引用传递,它是用于参数是类的对象,它传递的是这个对象的引用。面向对象的思想anything is Object(万物皆对象)抽象,从对具体的对象中抽取有用信息。对象有其固有属性,对象的方法,即对象的行为(对象能做什么)对象本身是简单的(功能简单),多个对象可以组成复杂的系统(对象之间彼此调用对
转载
2023-09-03 09:36:37
36阅读
Hadoop2系列才有的思想,Hadoop1系列设计比较冗余文件系统NameNode1.NameNode是一个中心服务器,单一节点(简化系统的设计和实现),负责管理文件系统的名字空间(namespace)以及客户端对文件的访问;2.副本存放在哪些DataNode上由NameNode来控制,根据全局情况做出块放置决定,读取文件时NameNode尽量让用户先读取最近的副本,降低带块消耗和读取时延;3.
转载
2023-07-13 00:07:06
55阅读