分类一般分为两种:  积极学习法:先根据训练集构造模型,然后根据模型对测试集分类  消极学习法:推迟建模,先简单存储训练集,等到给定测试集时再进行建模,如KNN算法。1. 简述  KNN核心思想就是:物以类聚,人以群分  即给定一个训练数据集,对于新输入实例,在训练集中找到与该实例最邻近K个实例,这K个实例多数属于某个类,就把该输入实例分为这个类2. K值选择  若K值较小,相当于用较小邻
KNN算法描述:(1)计算测试数据与各个训练数据之间距离;(2)按照距离递增关系进行排序;(3)选取
原创 2022-07-18 15:11:57
294阅读
思想(这个只有输出层神经网络也有用到):在Logistic回归中,1、首先介绍Sigmoid函数:      可以看到它值域(0,1),通过sigma函数计算出最终结果,以0.5为分界线,最终结果大于0.5则属于正类(类别值为1),反之属于负类(类别值为0)。2、将Sigmoid函数g(z)作为阀门,令Z=WT X,此时这里大写符号都是向量,
1.hdfs优缺点 (1)不适合大量小文件存储; (2)不适合并发写入,不支持文件随机修改;(只能append追加) (3)不支持随机读等低延时访问方式 2.基本思想 主从结构 主节点, namenode 从节点,有很多个: datanodenamenode负责: 接收用户操作请求 维护文件系统
IT
原创 2021-07-15 14:36:14
166阅读
K-近邻算法一、算法概述(1)采用测量不同特征值之间距离方法进行分类优点: 精度高、对异常值不敏感、无数据输入假定。缺点: 计算复杂度高、空间复杂度高。(2)KNN模型三个要素kNN算法模型实际上就是对特征空间划分。模型有三个基本要素:距离度量、K值选择和分类决策规则决定。距离度量距离定义为:一般使用欧式距离:p = 2个情况K值选择一般根据经验选择,需要多次选择对比才可以
http://blog.sina.com.cn/s/blog_67fcf49e0101g1lt.html
转载 2023-01-31 07:17:47
295阅读
  David Berlinkshi说:有两种思想,象珠宝商放在天鹅绒上宝石一样熠熠发光,一是微积分,另一个就是算法。如果说微积分及在其基础上建立数学分析体系造就了现代科学,而算法则造就了现代世界。 算法是计算机科学灵魂,更是每个程序员和软件工程师必需具有的核心知识。区分一个好软件工程师和一个代码磨工(coder)关键就在于看其是否能够分析并设计出高效率算法。正如爱因斯坦所说,并非
转载 2021-07-26 15:27:49
166阅读
层次聚类(hierarchical clustering)试图在不同层次对数据集进行划分,从而形成树形聚类结构。数据集划分可采用"自底向上"聚合策略(AGNES),也可采用"自顶向下"(DIANA) 分拆策略。1、AGNES算法简介AGNES 是一种采用自底向上聚合策略算法。它先将数据集中每个样本看作一个初始聚类簇,然后在算法运行每一步中找出距离最近两个聚类簇进行合并,该过程不断重
IOC/DI基本思想1.把程序之间依赖关系去掉2.把程序对象设置到IOC/DI容器配置中作为Bean3.由IOC/D。容器来管理Bean创建和实例化4.由IOC/DI容器来把Bean之间关系注入到须要这些关系对象里面
转载 2015-03-23 10:04:00
82阅读
回溯法又称试探法。回溯法基本做法是深度优先搜索,是一种组织得井井有条、能避免不必要重复搜索穷举式搜索算法。回溯算法基本思想是:从一条路往前走,能进则进,不能进则退回来,换一条路再试。当我们遇到某一类问题时,它问题可以分解,但是又不能得出明确动态规划或是递归解法,此时可以考虑用回溯法解决此
原创 2022-05-27 22:45:55
1113阅读
面向对象: 1、面向对象 EveryThing Is Object。 面向对象是一种程序设计思想,计算机程序设计实质上就是将现实中一些事物特征抽离出来描述成一些计算机事件过程,这种抽象过程中,我们把具体事物封装成一个一个整体进行描述,使被描述对象具备一些系统性、整体性行为和特征,我们把这种设计思想称为面向对象。 2、面向对象与面向过程 2.1、面向过程是早期程序语言设
面向对象思想是java核心思想。它不仅仅应用于编程。它更有利于解决自己身边种种问题,,,不扯淡,直入正题。面向对象思想是根据和符合于客观事实;所以理解面向对象思想,就应了解它客观本质。面向对象基本哲学是认为世界是由各种各样具有自己运动规律和内部状态对象所组成;不同对象之间相互作用和通讯构成了完整现实世界。因此,人们应当按照现实世界这个本来面貌来理解世界,直接通过对象及其相互关系
David Berlinkshi说:有两种思想,象珠宝商放在天鹅绒上宝石一样熠熠发光,一是微积分,另一个就是算法。如果说微积分及在其基础上建立数学分析体系造就了现代科学,而算法则造就了现代世界。算法是计算机科学灵魂,更是每个程序员和软件工程师必需具有的核心知识。区分一个好软件工程师和一个代码磨工(coder)关键就在于看其是否能够分析并设计出高效率算法。正如爱因斯坦所说,并非所有
转载 2022-04-06 11:32:18
224阅读
1.kNN算法优缺点优点简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归;可用于数值型数据和离散型数据;训练时间复杂度为O(n);无数据输入假定;对异常值不敏感。缺点:计算复杂性高;空间复杂性高;样本不平衡问题(即有些类别的样本数量很多,而其它样本数量很少);一般数值很大时候不用这个,计算量太大。但是单个样本又不能太少,否则容易发生误分。最大缺点是无法给出数据内在含
原创 2021-05-07 17:17:15
3155阅读
动态规划与贪心策略类似,将一个问题解决方案视为一系列决策结果。不同是,贪心算法每采用一次贪心选择便做出一个不可撤回决策,而在动态规划中,还要考察每个最优决策序列中是否包含一个最优决策自序列。使用动态规划时,所求问题应具有以下两种性质。 1.最优子结构性质 所求问题最优子结构性质是采用动态规划算法条件之一,这种性质又被称为最优化原理。动态规划方法采用最优化原理来建立用于计算最优解递归式。所谓最优化原理即不管前面的策略如何,此后决策必须是基于当前状态(由上一次决策产生)最优决策。由于对于有些问题某些递归式来说并不一定能保证最优原则,因此在求解问题时有必要对它进行验证。若不...
转载 2012-04-19 23:04:00
125阅读
2评论
原创 5月前
25阅读
1.kNN算法优缺点优点简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归;可用于数值型数据和离散型数据;训练时间复杂度为O(n);无数据输入假定;对异常值不敏感。缺点:计算复杂性高;空间复杂性高;样本不平衡问题(即有些类别的样本数量很多,而其它样本数量很少);一般数值很大时候不用这个,计算量太大。但是单个样本又不能太少,否则容易发生误分。
 理解面向对象需要做事 java面向对象思想核心是多态。多态机制也叫动态绑定机制。理解这些概念和核心思想比较好方式就是画内存图。把一个多态例子程序执行过程,在纸上画出来,那么就相对有一个较好理解了。分析问题三步走:第一,思考这个问题应该有哪些类,哪些对象。第二,思考这些类,这些对象中应该有什么属性和方法。第三,思考类和类之间应该存在什么样关系。那么类之间有什么样
Java中方法调用中参数传递有两种,一个是对于参数是基本类型使用是值传递(直接传参数值),另一个是引用传递,它是用于参数是类对象,它传递是这个对象引用。面向对象思想anything is Object(万物皆对象)抽象,从对具体对象中抽取有用信息。对象有其固有属性,对象方法,即对象行为(对象能做什么)对象本身是简单(功能简单),多个对象可以组成复杂系统(对象之间彼此调用对
转载 2023-09-03 09:36:37
36阅读
Hadoop2系列才有的思想,Hadoop1系列设计比较冗余文件系统NameNode1.NameNode是一个中心服务器,单一节点(简化系统设计和实现),负责管理文件系统名字空间(namespace)以及客户端对文件访问;2.副本存放在哪些DataNode上由NameNode来控制,根据全局情况做出块放置决定,读取文件时NameNode尽量让用户先读取最近副本,降低带块消耗和读取时延;3.
转载 2023-07-13 00:07:06
55阅读
  • 1
  • 2
  • 3
  • 4
  • 5