说起人工智能,很多人张口就能聊个五毛一块的。从历史到未来,从图灵到马斯克,从卷积神经网络再到朴素贝叶斯……但是如果问起模式识别、机器学习有什么区别,就有不少人懵圈了:这难道不是一样东西吗?居然还有区别?

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_模式识别

别怕,你不是一个人。模式识别、机器学习在人工智能领域本就是傻傻分不清楚的孪生兄弟。它们之间究竟有什么渊源,又有何种联系? 从发展史上来讲,这对孪生兄弟都是人工智能历史中辉煌一时的流派。其中模式识别可以归入人工智能领域的元老级别,可惜似乎已经有些过气的征兆,正在慢慢没落消亡。而机器学习则是人工智能领域最基础也是人气最高的天王级选手。

AI元老——模式识别

要想知道什么叫做模式识别,那就要先了解什么叫做模式。尽管我们经常把这个词语挂在嘴边,但是要想完全解释清楚,还真得耗费一番功夫。

首先,通常意义上,模式指用来说明事物结构的主观理性形式。它是从生产经验和生活经验中经过抽象和升华提炼出来的核心知识体系。但是需要注意的是,模式并不是事物本身,而是一种存在形式。

那什么是模式识别?它指的是,对表征事物或现象的各种形式的信息进行处理和分析,从而达到对事物或现象进行描述、辨认、分类和解释的目的。

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_人工智能_02

 模式识别从十九世纪五十年代兴起,在二十世纪七八十年代风靡一时,是信息科学和人工智能的重要组成部分,主要被应用于图像分析与处理、语音识别、声音分类、通信、计算机辅助诊断、数据挖掘等方面。尽管模式识别看起来很高大上,而且也有了较长时间的应用,但是其效果似乎总是差强人意。

例如人类见到一个东西之后,通常就会下意识地给其归类:是动物还是植物,属于哪一门纲目属科,是否可以药用,有果实吗,花朵是否漂亮,是否有毒……这一大串归类构成了人们对于这种事物的整体认知。这就属于人类对于模式的识别,这种技能对于人们甚至是一些动物来说,是非常简单而且几乎是与生俱来的。

但是在模式识别中,机器似乎并不如人们所预料的那样“智能”。这种经由人为提取特征后交给机器,然后让机器去判断其它事的属性的工作流程就像是按图索骥,按照这种方法,虽然有可能找到一匹真正的汗血宝马,但是也有可能找回一只满身恶臭的瘌蛤蟆。

因为对机器来说,哪怕是分辨最简单的“0”与“O”与“o”以及“。”都要费九牛二虎之力。而这也就是为什么我们在使用一些图片转文字等软件时,发现通常经过“翻译”的文本变得错字连篇,而且有时候错的不可思议。

尤其是目前还在大学里为论文苦苦挣扎的学生党,每当用软件转换CAJ文献或者PDF格式的材料时,时不时就会让人觉得这种人工智能简直就是“人工智障”。

AI大众情人——机器学习

不同于模式识别中人类主动去描述某些特征给机器,机器学习可以这样理解:机器从已知的经验数据(样本)中,通过某种特定的方法(算法),自己去寻找提炼(训练/学习)出一些规律(模型);提炼出的规律就可以用来判断一些未知的事情(预测)。

也就是说,模式识别和机器学习的区别在于:前者喂给机器的是各种特征描述,从而让机器对未知的事物进行判断;后者喂给机器的是某一事物的海量样本,让机器通过样本来自己发现特征,最后去判断某些未知的事物。

通俗些来说,模式识别更像是以前我们经历的填鸭式教育,老师教给学生的知识都是纸上谈兵;而机器学习则更像是读万卷书行万里路。

从技术角度分析,机器学习一般会将人类投喂的各种样本以一种数据的形式解析。我们看到的黑色其实只是电脑中RGB都为0的三个参数,白色则是RGB都为255的三个参数。因此在机器的世界里对黑白的分辨是分外容易的。

机器根据某一事物的海量样本,总结出这一类型事物所具有的普遍规律,总结过程所使用的技能就是我们常说的算法。当足够多的样本使得算法能够总结出一套行之有效的规律后,机器就可以用这些规律对真实世界中的事件做出决策和预测。

 

比如,机器通过一百万个单身狗的样本,总结出了单身狗所具有的一些属性。当下次再给一个样本时,机器就可以很快判断出这个样本究竟是不是单身狗。

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_机器学习_03

如果统计进一步细化,看一看原始样本中的单身狗都分别是多大年龄脱单,他们的脱单对象都是什么类型,那么机器就可以判断出下一个单身狗样本究竟会在十年后脱单,还是会一辈子孤单。

听起来是不是有那么一点点的玄幻?不要怀疑,机器的预测肯定会比塔罗牌、星座更准,它甚至比你自己还要了解你。

值得一提的是,在机器学习中,尽管电脑可以自行通过样本总结规律,但是依旧需要人工干预来为其提供规律总结的方向以及维度。例如色彩识别需要统计色彩的RGB或者CMYK值,但是要想总结出单身狗的特质,需要统计的就不仅仅是一两个简单的维度了。

例如年龄的数字,身高的数字,肤色的RGB,学识的等级,还有掌握的其他技能例如撒娇、体贴、男子力、女子力,性格的归类,社交程度的评价等等。

但是,最重要的一个参数就是脸,嗯,没错,就是我们常说的颜值。

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_人工智能_04

否则杨贵妃怎么会在“养在深闺人未识”这种其他参数一片空白的情况下,最后却能“后宫佳丽三千人,三千宠爱在一身”?不得不说,参数与参数之间也是有高低前后之分的。这种参数维度的确定以及参数重要性的评估,综合起来就是模型的建构。

在机器学习领域有着许多不同的流派,不同流派间的算法与建构的模型也是千差万别。就像是在武林江湖中,大家都有一技之能傍身,有人是内功修行,有人是外在技术修行,虽然都是一等一的高手,但是降龙十八掌和独孤九剑则代表了不同的武学巅峰。

最常见的两种模型分别为符号主义所使用的决策树模型和联结主义所使用的神经网络模型,每种又分别有着相应的多种算法。也就正如武林中的内功有降龙十八掌、九阳神功还有九阴真经,外在技术修行则有独孤九剑、落英神剑以及名门暗器等等。

 

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_机器学习_05

尽管技术不断兴替,但无一例外的是,新技术的发展是总是建立在原有技术的基础之上。每一个新的成就都是站在巨人的肩膀上所取得的。

尽管新的技术会不断占领潮流,但是这并不意味着旧有技术已经过时。在人工智能领域,模式识别虽然已经逐渐式微,但是它依旧有其独特的作用。例如在一些简单的色彩识别领域,参数维度相对单一,界定也相对明显,如果用大数据去建模计算,无疑是一种大才小用。闻道有先后,术业有专攻——不同的算法,可以在不同领域发挥各自的效用。

Pattern Recognition and Machine Learning模式识别与机器学习中文PDF 模式识别与机器学习_机器学习_05