想法很简单,先泛读,然后专攻。

wKiom1m2UebxzfM_AAQoJTwmj2I126.jpg


奇点:奇点是宇宙大爆炸之前宇宙存在的一种形式。它具有一系列奇异的性质,无限大的物质密度、无限弯曲的时空和无限趋近于0的熵值等


机器人:机器人(Robot)是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作,例如生产业、建筑业,或是危险的工作。


机器人三大定律

第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管

第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外

第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存



图灵测试: 指测试者与被测试者(一个人或者一台机器)隔开的情况下,测试者通过一些装置(如键盘)向 被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。


意识:人脑对大脑内外表象的觉察。生理学上,意识脑区指可以获得其它各脑区信息的意识脑区(在前额叶周边)。意识脑区最重要的功能就是辨识真伪,即它可以辨识自己脑区中的表象是来自于外部感官的还是来自于想像或回忆的。


阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。


机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

逼近论:是数学的一个分支。研究用较简单的函数,如多项式、三角多项式等来代替(逼近)较复杂的函数。

算法复杂度:是指算法在编写成可执行程序后,运行时所需要的资源,资源包括时间资源和内存资源。应用于数学和计算机导论。



人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。


深度学习:是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。


数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。


知识图谱(Knowledge Graph/Vault)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。


分类:是指按照种类、等级或性质分别归类。


聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。


预测:指在掌握现有信息的基础上,依照一定的方法和规律对未来的事情进行测算,以预先了解事情发展的过程与结果


回归:归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,…,Yi是因变量,X1、X2,…,Xk是自变量。


时间序列分析 是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律以用于解决实际问题。


概率论 是研究随机现象数量规律的数学分支。随机现象是相对于决定性现象而言的。


演绎:是铺陈、表现的意思。其基本意义是 从前提必然地得出结论的推理;从一些假设的命题出发,运用逻辑的规则,导出另一命题的过程,由一般原理推演出特殊情况下的结论。


:热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。


专家系统:是一种模拟人类专家解决领域问题的计算机程序系统。


机器翻译:又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。


推荐系统:利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。


自然语言处理:它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。


知识库:知识库有两种含义:一种是指专家系统设计所应用的规则集合,包含规则所联系的事实及数据,它们的全体构成知识库。这种知识库是与具体的专家系统有关,不存在知识库的共享问题;另一种是指具有咨询性质的知识库,这种知识库是共享的,不是一家所独有的。


自动驾驶:动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。


脸识别:是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。


语音助手:是一款智能型的手机应用,通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,其主要是帮忙用户解决生活类问题。


正则表达式:又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。


图片搜索:通过搜索程序,向用户提供互联网上相关的图片资料的服务。图片搜索的目的是查找出自己所需要的特定图片。


启发式搜索(Heuristically Search):又称为有信息搜索(Informed Search),它是利用问题拥有的启发信息来引导搜索,达到减少搜索范围、降低问题复杂度的目的,这种利用启发信息的搜索过程称为启发式搜索。


最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。


模拟退火:它的原理也和金属退火的原理近似:将热力学的理论套用到统计学上,将搜寻空间内每一点想像成空气内的分子;分子的能量,就是它本身的动能;而搜寻空间内的每一点,也像空气分子一样带有“能量”,以表示该点对命题的合适程度。演算法先以搜寻空间内一个任意点作起始:每一步先选择一个“邻居”,然后再计算从现有位置到达“邻居”的概率。


命题逻辑:是指以逻辑运算符结合原子命题来构成代表“命题”的公式,以及允许某些公式建构成“定理”的一套形式“证明规则”。相对于谓词逻辑,它是量化的并且它的原子公式是谓词函数;和模态逻辑,它可以是非真值泛函的


一阶(递归):公理化理论是通过增加一阶句子/断定的递归可枚举集合作为公理,可以被公理化为一阶逻辑扩展的理论。这里的"..."叫做谓词并表达某种性质。谓词是适用于某些事物的表达。所以,表达"是黄色"或"喜欢椰菜"分别适用于是黄色或喜欢椰菜的那些事物。


自然演绎:在数理逻辑中,自然演绎是证明论中尝试提供象“自然”发生一样的逻辑推理形式模型的一种方式。这种方式对比于使用公理的公理系统。


自动机:是有限状态机(FSM)的数学模型。


形式文法:计算机科学中的概念,在计算机科学中,形式语言是某个字母表上一些有限长字串的集合,而形式文法是描述这个集合的一种方法。形式文法之所以这样命名,是因为它与人类自然语言中的文法相似的缘故。形式文法描述形式语言的基本想法是,从一个特殊的初始符号出发,不断的应用一些产生式规则,从而生成出一个字串的集合。产生式规则指定了某些符号组合如何被另外一些符号组合替换。


特征工程:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用


增量学习:(Incremental Learning)是指一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。增量学习非常类似于人类自身的学习模式。

增量学习主要表现在两个方面:一方面由于其无需保存历史数据,从而减少存储空间的占用;另一方面增量学习在当前的样本训练中充分利用了历史的训练结果,从而显著地减少了后续训练的时间。


动态规划程序设计:是对解最优化问题的一种途径、一种方法,而不是一种特殊算法。不像搜索或数值计算那样,具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划算法,可以解决各类最优化问题。因此读者在学习时,除了要对基本概念和方法正确理解外,必须具体问题具体分析处理,以丰富的想象力去建立模型,用创造性的技巧去求解。我们也可以通过对若干有代表性的问题的动态规划算法进行分析、讨论,逐渐学会并掌握这一设计方法。


逻辑程序设计:将逻辑直接作为程序设计语言并将计算作为受控推理的一种程序设计技术。


Prolog:(Programming in Logic的缩写)是一种逻辑编程语言。它建立在逻辑学的理论基础之上, 最初被运用于自然语言等研究领域。现已广泛的应用在人工智能的研究中,可以用来建造专家系统、自然语言理解、智能知识库等。同时对一些通常的应用程序的编写也很有帮助,能够比其他的语言更快速地开发程序,因为它的编程方法更象是使用逻辑的语言来描述程序。


LISP:是一种通用高级计算机程序语言,长期以来垄断人工智能领域的应用。LISP作为因应人工智能而设计的语言,是第一个声明式系内函数式程序设计语言,有别于命令式系内过程式的C、Fortran和面向对象的Java、C#等结构化程序设计语言。


Scheme:遵循极简主义哲学,以一个小型语言核心作为标准,加上各种强力语言工具(语法糖)来扩展语言本身。


Clojure:是一种运行在Java平台上的 Lisp 方言,Lisp是一种以表达性和功能强大著称的编程语言,但人们通常认为它不太适合应用于一般情况,而Clojure的出现彻底改变了这一现状。如今,在任何具备 Java 虚拟机的地方,您都可以利用 Lisp 的强大功能。


对话系统:对话有几个特征:1)角色切换:对话中通常有两个甚至多个角色,各角色交替进行表达;2)连贯性:对话的内容前后是有关联的、有逻辑的;3)多模态:语音、文字、图片都可以成为对话中传递信息的方式。那么,对话系统的定义就是能与人进行连贯对话的计算机系统。从另一个角度来理解,对话系统让一种新的人机交互方式成为可能,即基于对话的交互(CUI:Conversational User Interface)


贝叶斯网络:又称信度网络,是Bayes方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一


自动规划:是一种重要的问题求解技术。与一般问题求解相比,自动规划更注重于问题的求解过程,而不是求解结果。此外,规划要解决的问题,如机器人世界问题,往往是真实世界问题,而不是比较抽象的数学模型问题。与一些求解技术相比,自动规划系统与专家系统均属高级求解系统与技术。


高斯分布:正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution


线性回归:是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x+e,e为误差服从均值为0的正态分布。

回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。


生成模型:是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如对一个概率密度函数产生的数据建模),或者作为建立条件概率密度函数的中间过程。条件概率分布可以由生成模型根据贝叶斯准测形成。

生成模型:一般是学习一个代表目标的模型,然后通过它去搜索图像区域,然后最小化重构误差。类似于生成模型描述一个目标,然后就是模式匹配了,在图像中找到和这个模型最匹配的区域,就是目标了


判别模型:将跟踪问题看成一个二分类问题,然后找到目标和背景的决策边界。它不管目标是怎么描述的,那只要知道目标和背景的差别在哪,然后你给一个图像,它看它处于边界的那一边,就归为哪一类。


朴素贝叶斯法:是基于贝叶斯定理与特征条件独立假设的分类方法[1]  。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。


logistic回归:又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。


BP(back propagation)神经网络:是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络。[1]


核方法kernel methods (KMs):是一类模式识别的算法。其目的是找出并学习一组数据中的相互的关系。用途较广的核方法有支持向量机、高斯过程等。

核方法是解决非线性模式分析问题的一种有效途径,其核心思想是:首先,通过某种非线性映射将原始数据嵌入到合适的高维特征空间;然后,利用通用的线性学习器在这个新的空间中分析和处理模式。


矩阵分解 (decomposition, factorization):是将矩阵拆解为数个矩阵的乘积,可分为三角分解、满秩分解、QR分解、Jordan分解和SVD(奇异值)分解等,常见的有三种:1)三角分解法 (Triangular Factorization),2)QR 分解法 (QR Factorization),3)奇异值分解法 (Singular Value Decomposition)。


主成分分析(Principal Component Analysis,PCA): 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。


支持向量机(Support Vector Machine,SVM):是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。


马尔可夫随机场(Markov Random Field):也有人翻译为马尔科夫随机场,马尔可夫随机场是建立在马尔可夫模型和贝叶斯理论基础之上的,它包含两层意思:一是什么是马尔可夫,二是什么是随机场。


框架效应(Framing effects):框架效应是指一个问题在两种逻辑意义上相似的说法却导致了不同的决策判断。


决策树(Decision Tree):是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。


随机森林:指的是利用多棵树对样本进行训练并预测的一种分类器。


感知器(Perceptron):是神经网络中的一个概念


邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法:是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。


语言模型:是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系。语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系


中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。


名实体识别(Named Entity Recognition,后文简称NER)是指从文本中识别具有特定类别的实体(通常是名词),例如人名、地名、机构名、专有名词等。命名实体识别是信息检索,查询分类,自动问答等问题的基础任务,其效果直接影响后续处理的效果,因此是自然语言处理研究的一个基础问


从文本中识别实体并抽取实体之间的语义关系


句法分析(Parsing):就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。


语义分析:是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查,审查每个算符是否具有语言规范允许的运算对象,当不符合语言规范时,编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些某些程序规定运算对象可被强制,那么当二目运算施于一整型和一实型对象时,编译程序应将整型转换为实型而不能认为是源程序的错误。


篇章分析:的最终目标是从整体上理解篇章,最重要的任务是分析篇章结构。篇章结构包括:语义结构,话题结构,指代结构等。


情感分析:是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观的,但是情感量化分析已经有很多有用的实践,比如企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息。


数据摘要算法:是密码学算法中非常重要的一个分支,它通过对所有数据提取指纹信息以实现数据签名、数据完整性校验等功能,由于其不可逆性,有时候会被用做敏感信息的加密。数据摘要算法也被称为哈希(Hash)算法、散列算法。


TF-IDF(term frequency–inverse document frequency):是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆向文件频率(Inverse Document Frequency)。


LDA(Latent Dirichlet Allocation):是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。[1] 

LDA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序,这简化了问题的复杂性,同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。


卷积:通俗的讲,卷积其实就是加权求和,卷积模板就是权值。


滤波:顾名思义,就是将某一部分波过滤掉。


二阶逻辑:允许有各种解释;它经常被认为包含在域的子集上,或在来自这个域到自身的函数上的量化,而不只是在这个域的个别成员之上。例如,如果这个域是所有实数的集合,通过如下书写你可以在一阶逻辑中断言每个实数的加性逆元的存在性


自动定理证明:是人工智能研究领域中的一个非常重要的课题,其任务是对数学中提出的定理或猜想寻找一种证明或反证的方法。因此,智能系统不仅需要具有根据假设进行演绎的能力,而且也需要一定的判定技巧。


CSP(约束满足问题):由一个变量集合和一个约束集合组成。问题的一个状态是由对一些或全部变量的一个赋值定义的完全赋值:每个变量都参与的赋值。问题的解是满足所有约束的完全赋值,或更进一步,使目标函数最大化。


描述逻辑(DescriptionLogic):是基于对象的知识表示的形式化,它吸取了KL-ONE的主要思想,是一阶谓词逻辑的一个可判定子集。除了知识表示以外,描述逻辑还用在其它许多领域,它被认为是以对象为中心的表示语言的最为重要的归一形式。描述逻辑的重要特征是很强的表达能力和可判定性,它能保证推理算法总能停止,并返回正确的结果。在众多知识表示的形式化方法中,描述逻辑在十多年来受到人们的特别关注,主要原因在于:它们有清晰的模型-理论机制;很适合于通过概念分类学来表示应用领域;并提供了很多有用的推理服务。


命题逻辑:是指以逻辑运算符结合原子命题来构成代表“命题”的公式,以及允许某些公式建构成“定理”的一套形式“证明规则”。相对于谓词逻辑,它是量化的并且它的原子公式是谓词函数;和模态逻辑,它可以是非真值泛函的。


一阶逻辑:也叫一阶谓词演算,(FOL)允许量化陈述的公式,比如"存在着 x,..." (x) 或 "对于任何 x,..." (砢),这里的 x 是论域(domain of discourse)的成员。


自然演绎:在数理逻辑中,自然演绎是证明论中尝试提供象“自然”发生一样的逻辑推理形式模型的一种方式。这种方式对比于使用公理的公理系统。


本体论:从广义说,它指一切实在的最终本性,这种本性需要通过认识论而得到认识,因而研究一切实在最终本性的为本体论,研究如何认识则为认识论,这是以本体论与认识论相对称。



RDF:的基本思想很简单,就是说任何网络资源都可以唯一地用URI(统一资源标识符,Uniform Resource Identifier)来表示。在这里,可以简化地将URI理解成网址URL。


OWL :是一门供处理 web 信息的语言。


概念图(concept map):是一种用节点代表概念,连线表示概念间关系的图示法。概念图的理论基础是Ausubel的学习理论。知识的构建是通过已有的概念对事物的观察和认识开始的。学习就是建立一个概念网络,不断地向网络增添新内容。为了使学习有意义,学习者个体必须把新知识和学过的概念联系起来。Ausubel的先行组织者主张用一幅大的图画,首先呈现最笼统的概念,然后逐渐展现细节和具体的东西。


Cyc项目: 始于1984年,由当时的微电子与计算机技术公司开发。该项目最开始的目标是将上百万条知识编码成机器可用的形式,用以表示人类常识。


因果分析法:是通过因果图表现出来,因果图又称特性要因图、鱼刺图或石川图,它是1953年在日本川琦制铁公司,由质量管理专家石川馨最早使用的,是为了寻找产生某种质量问题的原因,发动大家谈看法,做分析,将群众的意见反映在一张图上,就是因果图。用此图分析产生问题的原因,便于集思广益。因为这种图反映的因果关系直观、醒目、条例分明,用起来比较方便,效果好,所以得到了许多企业的重视。


推理解释:最佳解释推理可以看作是扩展了“自明”(self-evidencing)解释——被解释的现象反过来又成为相信解释之正确的重要理由。


前项链接:是数据驱动(datadriven)的推理技术。从已知数据开始展开推理。每一次只执行顶端的一条规则。当有规则被触发时,就有新事实加入数据库。任何规则只能被执行一次。当没有规则可触发时,匹配-触发循环终止。


后向链接:是目标驱动的推理技术。在后向链接中,专家系统有目标(一个假设的答案),推理引擎的任务是找出证明目标的论据。首先,在知识库中搜寻含有目标的规则,即THEN部分包含的目标规则。如果找到这种规则,在数据库中也有匹配的事实,就触发规则并证明目标。不过这种情况很少见。所以,推理引擎就暂不考虑这类规则(将规则压栈),要建立新目标,即子目标,以证明压栈规则的IF部分。接下来,再次查找知识库中能证明子目标的规则。推理引擎不断将规则压栈,直到知识库中的所有规则都不能证明子目标。


模糊推理:以模糊集合论为基础描述工具,对以一般集合论为基础描述工具的数理逻辑进行扩展,从而建立了模糊推理理论。是不确定推理的一种。在人工智能技术开发中有重大意义。


语义网:是对未来网络的一个设想,现在与Web 3.0这一概念结合在一起,作为3.0网络时代的特征之一。简单地说,语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值。

语义网,它的核心是:通过给万维网上的文档 (如:HTML文档、XML文档)添加能够被计算机所理解的语义“元数据”(外语:Meta data),从而使整个互联网成为一个通用的信息交换媒介


多AGENT系统:由分布在网络上的多个问题求解器松散耦合而成的大型复杂系统,这些问题求解器相互作用以解决由单一个体的能力知识所不能处理的复杂问题。


竞争型神经网络:基于无监督学习方法(unsupervised learning)的神经网络的一种重要类型,它经常作为基本的网络形式,构成其他一些具有组织能力的网络,如自组织映射网络、自适应共振理论网络、学习向量量化网络等。


自组织特征映射 (Self-Organizing Feature Mapping):即自组织特征映射网络 ,简称 SOFM或SOM,是由芬兰神经网络专家Kohonen 于1981年提出的。自组织特征映射是一种竞争学习网络,可以通过神经元之间的竞争实现大脑神经系统中的“近兴奋远抑制”功能,并具有把高维输入映射到低维的能力(拓扑保形特性)。

如果在学习过程中逐步缩小神经元之间的作用邻域, 并用 hebb 学习规则增强中心神经元的激活程度,则去掉各神经元之间的侧向连接也能得到“近兴奋远抑制”的效果。这就是 Kohonen 的自组织特征映射(SOFM)的思路。


期望最大化(Expectation-maximization):算法在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。


图模型:属于结构模型,可用于描述自然界和人类社会中的大量事物和事物之间的关系。在建模中采用图模型可利用图论作为工具。


MCMC(马尔科夫链蒙特卡洛方法)方法:它包括两个非常著名的采样算法(metropolis-hasting算法和它的特例Gibbs采样算法)(补充:MCMC方法最早由Metropolis(1954)给出,后来Metropolis的算法由Hastings改进,合称为M-H算法。M-H算法是MCMC的基础方法。由M-H算法演化出了许多新的抽样方法,包括目前在MCMC中最常用的Gibbs抽样也可以看做M-H算法的一个特例)。


gibbs:采样需要知道样本中一个属性在其它所有属性下的条件概率,然后利用这个条件概率来分布产生各个属性的样本值。gibbs采样属于随机模拟抽样算法中的一种(一类近似求解的方法)


隐马尔可夫模型(Hidden Markov Model,HMM):是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模型。


Hopfield神经网络:是一种循环神经网络,由约翰·霍普菲尔德在1982年发明。Hopfield网络是一种结合存储系统和二元系统的神经网络。它保证了向局部极小的收敛,但收敛到错误的局部极小值(local minimum),而非全局极小(global minimum)的情况也可能发生。Hopfield网络也提供了模拟人类记忆的模型。


规则学习:实质上就是能用大量的例证来说明规则所反映的关系,或者说,能运用规则在其适用的各种不同情景中办事。所以加涅认为,掌握与运用规则可能是人类最主要的一种智慧技能。


遗传算法(Genetic Algorithm):是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的,而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。


进化程序:一般概念所谓的进化程序 (Evolutionary Program) ,就是能够生成另外一个程序的程序。所形成的新程序与先程序可以有一定的联系 ,也可以完全无关。


强化学习(reinforcement learning):又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。

但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习(unsupervised learning)、监督学习(supervised leaning)和强化学习。


迁移学习:可以从现有的数据中迁移知识,用来帮助将来的学习。迁移学习(Transfer Learning)的目标是将从一个环境中学到的知识用来帮助新环境中的学习任务。因此,迁移学习不会像传统机器学习那样作同分布假设。


集成学习:是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。


细胞自动机(cellular automata):是为模拟包括自组织结构在内的复杂现象提供的一个强有力的方法,也称为元胞自动机(Cellular Automaton)。细胞自动机模型的基本思想是:自然界里许多复杂结构和过程,归根到底只是由大量基本组成单元的简单相互作用所引起。细胞自动机主要研究由小的计算机或部件,按邻域连接方式连接成较大的、并行工作的计算机或部件的理论模型。它分为固定值型、周期型、混沌型以及复杂型。


人工生命(AL:Artificial life):是通过人工模拟生命系统,来研究生命的领域。人工生命的概念,包括两个方面内容:1)、属于计算机科学领域的虚拟生命系统,涉及计算机软件工程与人工智能技术,以及2)、基因工程技术人工改造生物的工程生物系统,涉及合成生物学技术。


卡尔曼滤波(Kalman filtering):一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程。


傅立叶变换:表示能将满足一定条件的某个函数表示成三角函数(正弦和/或余弦函数)或者它们的积分的线性组合。在不同的研究领域,傅立叶变换具有多种不同的变体形式,如连续傅立叶变换和离散傅立叶变换。最初傅立叶分析是作为热过程的解析分析的工具被提出的。


马尔可夫决策:过程是基于马尔可夫过程理论的随机动态系统的最优决策过程。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物,故又称马尔可夫型随机动态规划,属于运筹学中数学规划的一个分支。


卷积神经网络:是一种前馈神经网络,人工神经元可以响应周围单元,可以大型图像处理。卷积神经网络包括卷积层和池层。


循环神经网络:RNN(Recurrent Neuron Network)是一种对序列数据建模的神经网络,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。


提升方法:是基于这样一种思想:对于一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独的判断好。通俗点说,就是”三个臭皮匠顶个诸葛亮”


排序学习:是在处理排序问题时采用的利用机器学习方法来训练模型的方法。排序学习可以应用在信息检索、自然语言处理、数据挖掘等方面。


奥卡姆剃刀:当两个假说具有完全相同的解释力和预测力时,我们以那个较为简单的假说作为讨论依据。”(


Haskell:是一种标准化的、通用纯函数式编程语言,有非限定性语义和强静态类型


模型论(Model theory):是数学的一个学科,模型论的一些重要定理,如紧致性定理,L-S-T 定理,省略型定理, 插值定理等等,不仅对逻辑,集合论,递归论的研究有重要作用 ,而且也在数论、代数、拓扑等数学学科中得到应用


世界模型:在每个人的内心当中都有一个对世界的认知和描绘,这种认知和描绘就叫“世界模型”。每个人的世界模型都是不一样的。这个世界模型的建立依赖于我们的视觉、听觉、触觉、味觉和嗅觉接受讯息,并透过我们则感知结果不同的体验及诠释而形成了不同的世界模型。


范畴论:是抽象地处理数学结构以及结构之间联系的一门数学理论,以抽象的方法来处理数学概念,将这些概念形式化成一组组的“物件”及“态射”。有些人开玩笑地称之为“一般化的抽象废话”。范畴论出现在很多数学分支中,以及理论计算机科学和数学物理的一些领域。


图灵机:就是指一个抽象的机器,它有一条无限长的纸带,纸带分成了一个一个的小方格,每个方格有不同的颜色。有一个机器头在纸带上移来移去。机器头有一组内部状态,还有一些固定的程序。在每个时刻,机器头都要从当前纸带上读入一个方格信息,然后结合自己的内部状态查找程序表,根据程序输出信息到纸带方格上,并转换自己的内部状态,然后进行移动。


情境理论:可以称之为权变理论,基本假定为:不同的情境需要不同的领导,是从领导这一现象出发而产生的理论。研究都是从领导类型和情境变量两个点出发,是研究领导者与追随者之间的关系。


模态逻辑:逻辑的一个分支,它研究必然、可能及其相关概念的逻辑性质。


时态逻辑 tense logic 非经典逻辑的分支学科。其研究对象是,把含有时态动词的语句形式化,并且把含有这种语句的推理系统化。


事件演算:是基于一阶谓词演算的 行动推理理论。它可作为描述事件的一个工具,在行动推理的应用中显示出其强大的表示能力和实现能力。在事件演算中,可以对行动进行公理化,可以描述行动的 时间性、并发性、连续变化及知识,而且还可用Prolog实现。


空间逻辑:指事物所存在的空间位置


认识逻辑:是关心与知识有关的推理的模态逻辑子领域。(认识这个词的希腊语是 Episteme)。它应用于哲学、计算机科学、人工智能和其他领域。


非单调推理:于19世纪 70 年代被提出,是人工智能中的一种重要的推理方式。所谓非单调推理,指的是一个正确的公理加到理论T中,反而会使预先所得到的一些结论变得无效了。寻求失效的结论是单调逻辑中不存在的问题。从这个意义上说,非单调推理就明显地比单调推理来得复杂。

非单调推理的基本出发点是古典的完备性:对一个理论来说,任一公式P,或者是P可证明或者是P的非可证明。这样,为保证一个理论是完备的,可增加命题P,如果P的非不能由该理论推演出来,将这样的命题P假设是成立的,加到理论中参予推理,便是非单调的推理方式。



缺省逻辑:是 Ray Reiter 提出的用来形式化有缺省假定的推理的非单调逻辑。 缺省逻辑可以表达像“缺省的,某个事物是真的”的事实;相反的,标准逻辑只能表达某个事物为真或某个事物为假。这是一个问题,因为推理经常涉及在多数时候是真但不总是真的事实的推理。经典的例子是: “鸟通常会飞”。这个规则可以在标准逻辑中表达为要么“所有鸟都会飞”,这与企鹅不会飞的事实相矛盾;要么“除了企鹅、鸵鸟 ... 的所有鸟都会飞”,这要求规则指定出所有的例外。缺省逻辑致力于形式化像这样的推理规则,而不需要明确提及所有的例外。


认知机器人学:是通过给机器人提供一种处理架构而赋予机器人智能行为的学科。这一架构可以让机器人学习和推论出应付复杂世界的相应举措。我们可以把认识机器人学视为是具身认知科学和具身嵌入认知的一种工程分支。


不动点:是一个函数术语,在数学中是指“被这个函数映射到其自身一个点”。


VC维:反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大),遗憾的是,目前尚没有通用的关于任意函数集VC维计算的理论,只对一些特殊的函数集知道其VC维。例如在N维空间中线性分类器和线性实函数的VC维是N+1。


PAC可学习性:训练学习器的目标是,能够从合理数量的训练数据中通过合理的计算量可靠的学习到知识。


随机过程:是广泛使用的理论体系,在诸如天气预报、统计物理、天体物理、运筹决策、经济数学、安全科学、人口理论、可靠性及计算机科学等很多领域都要经常用到随机过程的理论来建立数学模型。


公理集合论(axiomatic set theory):是数理逻辑的主要分支之一,是用公理化方法重建(朴素) 集合论的研究以及集合论的元数学和集合论的新的公理的研究。


递归论(Recursion theory):是数理逻辑的重要分支之一,研究解决问题的可行的计算方法和计算的复杂程度的一门学科,尤其是研究递归函数及其推广。


效用理论:是领导者进行决策方案选择时采用的一种理论。决策往往受决策领导者主观意识的影响,领导者在决策时要对所处的环境和未来的发展予以展望,对可能产生的利益和损失作出反应,在决策问题中,把领导人这种对于利益和损失的独特看法、感觉、反应或兴趣,称为效用。效用实际上反映了领导者对于风险的态度。高风险一般伴随着高收益。对待数个方案,不同的领导者采取不同的态度和抉择。


博弈论:主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。


哥德尔不完全性定理:哥德尔证明了任何一个形式系统,只要包括了简单的初等数论描述,而且是自洽的,它必定包含某些系统内所允许的方法既不能证明真也不能证伪的命题。


没有免费午餐定理:最优化理论的发展之一是wolpert和Macerday提出了没有免费的午餐定理(No Free Lunch,简称NFL)。该定理的结论是,由于对所有可能函数的相互补偿,最优化算法的性能是等价的。该定理暗指,没有其它任何算法能够比搜索空间的线性列举或者纯随机搜索算法更优。该定理只是定义在有限的搜索空间,对无限搜索空间结论是否成立尚不清楚。


势函数:的构造是人工势场方法中的关键问题,典型的势函数构造方法:P(θ)=f{d(θ,θ0),[dR(θ),O],dT}(1),式中 θ,θ0——机器人当前位姿与目标位姿矢量;d(θ,θ0)——θ与θ0间的某种广义距离函数;dR(θ),O——当前位姿下机器人与障碍物间的最小距离;dT——给定的门限值;P(θ)分别为变量d(θ,θ0)和dR(θ),O的单调递增函数和单调递减函数。从机器人的起始位姿开始沿着P(θ)的下降方向进行搜索可使机器人在避开障碍物的前提下向目标位姿运动


选择公理:有很多等价的形式(equivalent form),以下用一个较简单的描述: 选择公理 设C为一个由非空集合所组成的集合。那么,我们可以从每一个在C中的集合中,都选择一个元素和其所在的集合配成有序对来组成一个新的集合。


流形学习:全称流形学习方法(Manifold Learning),自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。


变分推断:用简单的分布q去近似复杂的分布p。


递归可枚举集:又称部分递归集。在能行性理论中,基本概念是递归函数,它可刻画为:任给x,只要它在x处有定义必可在有限步骤内求出其值。因此递归全函数(即处处有定义的)必可在有限步骤内求出它的任一值,至于递归部分函数(未必处处有定义的)则只要求有定义处可求出其值,但不要求能够在有限步骤内判定它的定义域的元素,即对任给的x判定x是否属于函数的定义域。


量子计算:是一种遵循量子力学规律调控量子信息单元进行计算的新型计算模式。对照于传统的通用计算机,其理论模型是通用图灵机;通用的量子计算机,其理论模型是用量子力学规律重新诠释的通用图灵机。从可计算的问题来看,量子计算机只能解决传统计算机所能解决的问题,但是从计算的效率上,由于量子力学叠加性的存在,目前某些已知的量子算法在处理问题时速度要快于传统的通用计算机


语义信息(semantic information):是指任何有含义的语言, 文字, 数据, 符号·.....提供的信息,而信息就是我们以前不知道的事物特定状态。