参考文献: 人工智能标准化白皮书
人工智能在半个多世纪的发展历程中,由于受到智能算法、计算速度、存储水平等多方面因素的影响,人工智能技术和应用发展经历了多次高潮和低谷。近年来,随着以深度学习为代表的机器学习算法在机器视觉和语音识别等领域取得了极大的成功,识别准确性大幅提升,使人工智能再次受到学术界和产业界的广泛关注。
人工智能至今大致分为以下几个发展阶段。(下图为“人工智能发展史”)。
图片来源“人工智能标准化白皮书”
目前,人工智能领域尚未形成完善的参考框架。因此,人工智能白皮书基于人工智能的发展状况和应用特征,从人工智能信息流动的角度出发,提出一种人工智能参考框架,力图搭建较为完整的人工智能主体框架,描述人工智能系统总体工作流程,不受具体应用所限,适用于通用的人工智能领域需求。
技术参考框架
人工智能参考框架提供了基于“角色—活动—功能”的层级分类体系,从“智能信息链”和“IT 价值链”两个维度阐述了人工智能系统框架。
“智能信息链”反映从智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。“IT 价值链”从人工智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程,反映人工智能为信息技术产业带来的价值(下图为“人工智能参考框架图”)。
图片来源“人工智能标准化白皮书”
此外,人工智能系统还有其它非常重要的框架构件。如安全、隐私、伦理和管理。人工智能系统主要由基础设施提供者、信息提供者、信息处理者和系统协调者等角色组成。
- 基础设施提供者
并通过基础平台实现支撑。计算能力由智能芯片(CPU、GPU、ASIC、FPGA 等硬件加速芯片以及其它智能芯片)等硬件系统开发商提供;与外部世界的沟通通过新型传感器制造商提供;基础平台包括分布式计算框架提供商及网络提供商提供平台保障和支持,即包括云存储和计算、互联互通网络等。
- 信息提供者
据提供商提供智能感知信息,包括原始数据资源和数据集。原始数据资源的感知涉及到图形、图像、语音、文本的识别,还涉及到传统设备的物联网数据,包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。
- 信息处理者
包括智能信息表示与形成、智能推理、智能决策及智能执行与输出。智能信息处理者通常是算法工程师及技术服务提供商,通过计算框架、模型及通用技术,例如一些深度学习框架和机器学习算法模型等功能进行支撑。
- 系统协调者
智能是多学科交叉领域,需要系统协调者定义和整合所需的应用活动,使其在人工智能领域的垂直系统中运行。系统协调者的功能之一是配置和管理人工智能参考框架中的其他角色来执行一个或多个功能,并维持人工智能系统的运行。
- 安全、隐私、伦理
有重要的影响作用。在安全、隐私、伦理模块,需要通过不同的技术手段和安全措施,构筑全方位、立体的安全防护体系,保护人工智能领域参与者的安全和隐私。
- 管理
管理角色承担系统管理活动,包括软件调配、资源管理等内容,管理的功能
是监视各种资源的运行状况,应对出现的性能或故障事件,使得各系统组件透明且可观。
- 产品及行业应用
方案的封装,将智能信息决策产品化、实现落地应用,其应用领域主要包括:智能制造、智能交通、智能家居、智能医疗、智能安防等。
人工智能技术趋势
依据参考框架中所涉及到的人工智能相关技术,在人工智能二十年来关键技术的发展状况来看,包括机器学习是人工智能的基础,结合知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术推动着人工智能的发展和应用。
机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。
基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法。
根据学习模式将机器学习分类为监督学习、无监督学习和强化学习等。
监督学习
监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射,最典型的监督学习算法包括回归和分类。监督学习要求训练样本的分类标签已知,分类标签精确度越高,样本越具有代表性,学习模型的准确度越高。监督学习在自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。
无监督学习
无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律,最典型的非监督学习算法包括单类密度估计、单类数据降维、聚类等。无监督学习不需要训练样本和人工标注数据,便于压缩数据存储、减少计算量、提升算法速度,还可以避免正、负样本偏移引起的分类错误问题。主要用于经济预测、异常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社交网络分析、市场分割、天文数据分析等。
强化学习
由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。强化学习的目标是学习从环境状态到行为的映射,使得智能体选择的行为能够获得环境最大的奖赏,使得外部环境对学习系统在某种意义下的评价为最佳。其在机器人控制、无人驾驶、下棋、工业控制等领域获得成功应用。
根据学习方法可以将机器学习分为传统机器学习和深度学习。
传统机器
得的规律,实现对未来数据行为或趋势的准确预测。相关算法包括逻辑回归、隐马尔科夫方法、支持向量机方法、K 近邻方法、三层人工神经网络方法、Adaboost算法、贝叶斯方法以及决策树方法等。
传统机器学习平衡了学习结果的有效性与学习模型的可解释性,为解决有限样本的学习问题提供了一种框架,主要用于有限样本情况下的模式分类、回归分析、概率密度估计等。传统机器学习方法共同的重要理论基础之一是统计学,在自然语言处理、语音识别、图像识别、信息检索和生物信息等许多计算机领域获得了广泛应用。
深度学习
信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深度神经网络(指层数超过3 层的神经网络)。深度学习作为机器学习研究中的一个新兴领域,由Hinton等人于2006 年提出。深度学习源于多层神经网络,其实质是给出了一种将特征表示和学习合二为一的方式。
深度学习的特点是放弃了可解释性,单纯追求学习的有效性。经过多年的摸索尝试和研究,已经产生了诸多深度神经网络的模型,其中卷积神经网络、循环神经网络是两类典型的模型。卷积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中引入了记忆和反馈,常被应用于时间性分布数据。
此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等。
迁移学习
一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到新的模型指导新模型训练,可以更有效的学习底层规则、减少数据量。目前的迁移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位,文字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、逻辑推理等。
主动学习
然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够选择性地获取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性准则和差异性准则选取有效的样本。
演化学习
解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、多目标演化算法等。目前针对演化学习的研究主要集中在演化数据聚类、对演化数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等。
>>>>>>>>>>>文末福利<<<<<<<<<<<
目前,对于从事软件行业来说,人工智能尖端人才远远不能满足需求。在中国人才缺口将超过上百万人,而中国人工智能人才数量目前只有几万人(数据来自工信部教育考试中心)。2017年人工智能在互联网岗位薪酬中位列第三,2018的薪酬数据更具诱惑。
对学习者来说,在面对众多的数学知识和编程知识里,自学会让大家耗费大量的时间金钱。