人工智能赋能金融科技
王健宗, 黄章成, 肖京
平安科技(深圳)有限公司
doi:10.11959/j.issn.2096-0271.2018035
论文引用格式:王健宗, 黄章成, 肖京. 人工智能赋能金融科技[J]. 大数据, 2018, 4(3): 111-116.
WANG J Z, HUANG Z C, XIAO J. Artificial intelligence energize Fintech[J]. Big Data Research, 2018, 4(3): 111-116.
**1 人工智能的历史和发展 ** 2016年的春天,AlphaGo战胜围棋世界冠军李世石的消息不胫而走,该事件将人工智能(artificial intelligence,AI)推上了有史以来的最高潮。一时间,各行各业都在设法使用人工智能提升产品性能、改善流程。2017年10月,AlphaGo的增强版AlphaGo Zero问世,不同于它的前身, AlphaGo Zero能够“从零开始”地“自我学习”,能够通过8个小时的训练击败李世石版本AlphaGo;通过4个小时的训练击败国际象棋程序Stockfish;通过2个小时的训练击败将棋程序Elmo。其展现出来的人工智能强大的自我学习能力,又一次掀起了人工智能应用的热浪。
1.1 从达特茅斯会议开始
1956年,约翰·麦卡锡(John McCarthy)召集了包含马文·闵斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(Claude Shannon,信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家)、赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)等在内的科学家,在达特茅斯召开了人工智能学术讨论会。这是人工智能的首次提出,因此学术界公认1956年为人工智能元年。从达特茅斯会议召开至今的60多年里,人工智能的发展犹如过山车一般经历了两次大起大落,目前正处于第三次的兴起当中。刚提出人工智能这个概念时,人们对智慧机器的期许极高,对未来前景非常看好,大量的研究经费投入人工智能的研究中。但是,由于刚起步,技术的发展跟不上人们的期望,再加上战乱导致经费不足,人工智能经历了第一次大起大落。人工智能第二次的兴起,是依托于统计模型对数据的处理效果,使得AI能够解决一些诸如识别类的问题。在这个时期,机器学习方法,包含决策树模型、贝叶斯模型、支持向量机(support vector machine,SVM)等的盛行,使人们似乎又看到了人工智能的希望。然而,渐渐地,有人开始发现,基于统计学模型的方法只适用于一些浅层问题,并且模型的准确性并不会随训练数据量的增加而上升。此外,对一些大数据的处理效果也不好,深度问题计算能力不足,更没有体现出智慧生物应有的自我学习与强化学习能力。因此,人工智能第二次兴起的热情也慢慢淡化。后来,数据量的不断增大和计算机硬件的不断进步,为人工智能的第三次兴起提供了土壤。1997年IBM深蓝打败国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov)以后,AI开始慢慢复苏。2006年,深度神经网络(deep neural network,DNN)在对大量数据的处理中取得了显著效果,成为了深度思考(deep mind)领域研究人员关注的对象。10年后,AlphaGo惊艳亮相,将AI逐渐推向了前所未有的高度。
深度学习神经网络同样经历了两起两落,而上一次的衰落主要受限于计算机能力、数据量不足以及黑盒子缺少可解释性。随着算法的改进、计算能力和数据量的大大增加,深度学习正处于第三次的兴起当中。深度学习作为机器学习的一个分支,在计算机视觉上应用能力最好的是卷积神经网络(convolution neural network,CNN),CNN可以应用在诸如对象识别、视频标注、行为辨识和它们的多种变体上。深度学习同样在声音、文本和自然语言理解(natural language processing,NLP)等方面意义深远。
1.2 Fintech和人工智能
金融作为一个需要极度敏锐嗅觉神经和热点关注能力的领域,自然“不可放过”科学技术的进步所带来的改革。Fintech一词最早是由花旗银行于1993年提出的,为Financial和Technology两词的合并。Google搜索指数显示,从2015到2016年, Fintech的搜索指数呈爆发式增长。在对金融数据的使用上,DNN模型主要应用在衍生品定价、投资组合构建、风险规避管理、高频交易等方面,但是深度学习的产品在金融中的运用范围远大于此。目前,几乎所有的科技巨头公司都在布局金融。
2 人工智能的代表性应用
近年来,随着我国保险行业稳步发展,财产保险行业也得以快速发展。机动车辆保险是目前市场投保最多的险种之一,在财产保险公司的保费中所占的比重超过70%。并且随着中国经济的发展,私家车数量逐年递增,车险的数量越来越多,成为众多财产保险公司争夺市场份额的重要关注点。2012—2016年我国汽车保险行业的保费收入如图1所示,可以看出保费收入逐年提高。
图1 2012—2016年我国汽车保险行业实现保费收入走势
保险理赔既是保险业务处理程序的最后环节,又是评估其他工作效率的最佳手段,更是保险人履行经济补偿和社会管理职能的具体体现,是验证保险公司业务质量和服务质量最重要的环节。车辆定损工作一直是一项专业技术性较强的工作,它是整个车险理赔服务中矛盾最突出的环节。目前车辆定损基本依靠人工识别进行,受人员技能影响大,定损偏差大,而且查勘定损人员需要在定损录入上花费大量时间,影响时效,制约了各种便捷理赔服务的推出。同时随着定损工作量的增大,保险公司定损成本也在不断增大。以中国平安保险(集团)服份有限公司为例,2017年无人伤案件全效时长高达13.4天,其中报案到定损就有6.8天,占整案时长的50%,时效太长,用户体验差。如何解决赔付过程中存在的问题对于提升客户满意度具有重大意义。
计算机图像处理技术近年来受到广泛关注,图像识别处理技术可以很好地应对。车辆定损中存在的时效长、手续复杂和人工勘察、审核开支大等问题,为了走在时代的前沿,笔者所在团队于2016年10月在理赔系统中实现纯油漆定损应用,并于2017年6月上线配件更换定损应用。
智能图像定损技术利用深度学习神经网络技术及强大的大数据挖掘逻辑规则,通过车损图片,在风险可控的前提下,自动计算损失项目、损失程度和损失价格。该项技术能够准确识别95%以上的整车损伤,并且通过建立的循环图片数据学习模型,将生产的数据经筛选后源源不断地提供给机器进行学习,持续提升准确率。基于智能闪赔技术,2017年上半年平安财产保险处理车险理赔案件超过499万件,客户净推荐值(net promoter score,NPS)高达82%,智能拦截风险渗漏达30 亿元。
图像识别的研究工作面临的最大挑战就是如何对特征进行提取。不像其他数据,图像无法通过人工理解提取特征。在深度学习之前,大都是借助尺度不变特征变换(scale-invariant feature transform,SIFT)、方向梯度直方图(histogram of oriented gradient,HOG)等算法,再结合诸如支持向量机(SVM)的机器学习算法对一些分区性良好的特征进行提取。后来,随着计算机能力的发展和深度卷积神经网络模型CNN的出现,越来越多的图像处理工作由CNN完成。
所谓的卷积神经网络最初是为解决图像识别等问题设计的,其概念最早出自感受野(receptive field)。19世纪60年代,科学家在研究猫的视觉神经细胞时发现,每一个视觉神经元只能处理一小块区域的视觉图像,这就是感受野。而CNN最初的实现原型,则是日本科学家提出的神经认知机(neocognitron)。
通常用来处理图像的有卷积神经网络LeNet5、AlexNet、VGGNet、Google Inception Net和ResNet等。CNN能够通过优化空间结构关系减少参数量的学习,从而使得图片识别的效果得到极大的提升。在CNN中,图像像素级数据作为输入数据进入第一个卷积层,每一个卷积层处理一小块图像并且进行卷积变换后往下一层级传输。在这个过程中,每一次传递都会从数据中提取并组合生成最优特征,因此CNN在应用范围上很广泛,并且理论上能够保持图像在缩放、平移和旋转中数据的稳定性。基于深度学习卷积神经网络的智能图像定损技术有以下几个功能。
(1)智能识别保险单号
在收到保险单图片后,首先,识别所述保险单图片对应的保险类型;然后,基于预定的保险类型与保险单号码在所述保险单图片中的位置关系,提取所述保险单号码在所述保险单图片中对应的目标行字符区域;最后,调用预先训练生成的第一识别模型对所述目标行字符区域进行字符识别,以获得所述目标行字符区域中包含的保险单号码,并将识别出的保险单号码与所述保险单图片进行关联存储。
(2)智能定型定件
智能定型定件能够通过车辆图片和车辆识别码(vehicle identification number, VIN)精确识别车组和车型,并且关联到车组配件库,实现唯一匹配。车辆检测的方法如下:首先,在接收到包含车辆信息的待检测图片后,通过预定的算法提取待检测图片的基本特征信息,并将基本特征信息输入预先训练生成的AND-OR模型中,以获取各层级节点,并将各层级节点作为关键节点输出;然后,将关键节点进行关联,以将关联的各层级关键节点作为较优的演算分支;将演算分支中的各层级关键节点转化为待检测图片中的位置参数,并根据预定的各层级关键节点与图形模板的关联关系确定演算分支中的各层级关键节点对应的图形模板;最后,根据演算分支中的各层级关键节点对应的位置参数和图形模板获取待检测图片中的车辆位置信息以及车辆布局关系并输出。
(3)图像流清洗
对图像进行处理的常用方法包括图像增强(将模糊的图片变清晰)、图像归正(自动矫正倾斜、翻转的图像)以及图像篡改、模糊提示等的复杂处理等。清晰度检测的大致流程如下:车险理赔服务器在收到用户终端上传的理赔照片后,采用预先训练生成的深度卷积神经网络模型对接收到的理赔照片进行清晰度识别,以确定所述理赔照片的清晰度等级。若所述理赔照片的清晰度等级低于预设清晰度等级,则发送提示信息至所述用户终端,以提醒用户重新上传理赔照片。
(4)图片篡改检测
图片篡改已十分普遍,构建图片反欺诈金融盾牌可广泛应用于车险中车辆定损图片的反欺诈、保单图片的反欺诈、身份证、驾驶证、遗嘱等许多方面。利用深度学习,可以有效定位图片可篡改区域,减少人工审查时间,提高检测准确率。
(5)部件分割归集
对车辆图片使用全链路端到端卷积神经网络模型,根据特征值进行部位的分割,准确识别车辆的外观部位,匹配车型零件库并且进行归类。此外还能识别和判断非车辆部位的干扰图片,类似于身份证、银行卡、水瓶等,并分到不同的文件夹内,从而减少人工分类。
(6)损失程度识别
15种外观件的维修类型覆盖了目前100 %的外观件损失状态,提供机器全量的损失学习。损失程度分为3种:一是表面无变形,即损失仅需喷漆就可以解决的轻度擦伤和划痕;二是变形程度可修复的,需要修复钣金,如一些撕裂、皱着、缺失或者大面积的凹陷等;三是无修复价值的,需要更换新的配件。
智能图像定损原理如图2所示。
图2 智能图像定损原理
现有的图像定损流程是利用图像检测和识别的技术对受损部位(前保险杠、后备箱盖、引擎盖等)进行检测。这种传统的方法有时比较容易造成受损部位检测遗漏或识别错误,在现有的算法下,还无法将识别的准确率和查全率做到100%。基于这项事实,提出交互式图像自动定损技术,即用户充当定损员的角色,对未识别出的受损部位进行二次判断,增加识别部位的准确率,与传统的图像自动定损技术相比,交互式图像自动定损技术的优势在于以下几点。
● 传统的图像自动定损只根据图像做一次性的判断,依赖一次算法的结果,在现有的技术条件下,无法将准确率和查全率做到100%,用户利用App得到第一次返回结果后,若觉得有未被识别出的部位,则可用框圈出认为受损的部位,放入系统中进行二次检测,得出结果。
● 增加用户交互的体验,使用户有实际参与感,可以增加用户对App的黏性。
● 在交互时,利用深度学习卷积神经网络,可以在很大程度上提高车辆部位分类的准确率。
交互式定损流程如图3所示。
图3 交互式定损流程
图像识别技术除了在定损方面的应用,还在其他多个现实场景中有应用价值,笔者所在公司目前积极推出的“平安牲畜识别”也是图像识别技术的代表应用。平安牲畜识别是一个高效、快捷、精准的农业+牲畜智能解决方案系统,具备牲畜识别、数量清点、智能录入、声纹诊断和遥感监测等功能,可以通过牲畜及身份证、银行卡(户口本)照片,快速完成投保理赔,实现农场信息化管理,对农场内每个动物的健康情况、喂食次数等进行随时监控,并且能够保障食品安全,追踪系统内每一头猪、牛的健康状况。此外,还可应用于养殖健康管理,对养殖人员和牲畜进行双重信息监控,从源头关注养殖过程的标准化、健康化。
3 结束语
从AI发展的历史来看,AI现在处于第三次兴起的时期,且为兴起的初期。但是,已经有琳琅满目的产品争相出现,大家似乎已经看到了AI领域未来的曙光。人工智能将在不久的将来颠覆一些传统的生活、工作和娱乐方式,这种改变并非是令人恐惧的,而是为了让人类更好地生活。
不仅是金融领域,以后的行业会更加集成化,行业与行业之间的壁垒在降低,很多看似不相关的领域都能通过互联网、物联网联系起来,因此AI技术在未来将深入人们工作、生活、娱乐的方方面面。目前,笔者所在的研究团队在深度上,已经着手研究AI智能音乐等;在广度上,加大了现有技术在各个应用领域的商务合作,并且正在扩展技术能够运用到的更大的领域。此外,对于现有的技术,也积极开放接口,实现全行业共享,提升全行业信息化、科技化、智能化水平。未来也将继续从人工智能的技术提升和应用场景两方面同时着力,力求释放AI技术的最大价值,为国家智能化建设添砖加瓦。