为何2019年FRM新考纲重点关注机器学习?_FRM

 

“人工智能+机器学习”在本文缩写为AIML。

 

2018年FRM二级考纲史无前例地引入了三篇“机器学习+人工智能”论文,而2019年的新考纲则囊括了四篇AIML论文。FRM考纲历来以风格激进著称:将最前沿、最具前途的金融黑科技毫不犹豫地纳入当年的新考纲。由此可见,席卷全球的AIML风潮不仅丝毫不见褪色,反而愈加大红大紫。

 

2017年12月,当我拿到2018年的FRM考纲,第一次见到AIML的考试要求时,内心是忐忑不安的。AIML在我2001年读研时便早有接触,那时还叫“模式识别”。因此我深知:AIML不是区区几个轻薄的知识点,而是浩如烟海的鸿篇巨作,花上几年的苦功都未必掌握。若在短短两个月间,便要求老师精熟课程并且能够堂而皇之地向同学们布道,这项任务不简单!

 

于是从2017年12月至今,我陷入了疯狂的、无法停歇的学习大战。除了工作、训练、居家生活,整个2018年我的生活主题只有八个字:学习机器、机器学习。去北京、深圳出差时带着电脑在学习,去浙江山区训练时带着电脑在学习,去文莱、日本度假时依然带着电脑在学习。

 

2018年我学完的“网易云课堂”微专业:

  1. 机器学习工程师(在学)

  2. Linux高端运维工程师

  3. MySQL数据库工程师

  4. 人工智能数学基础

  5. 吴恩达:深度学习工程师

 

2018年我在“网易云课堂”完成的AIML相关课程(部分):

  1. 2019美国大学生数学建模竞赛培训(在学)

  2. 2017年数模获奖论文精析

  3. 数模国赛参赛技巧与MATLAB应用

  4. 数模竞赛临门一脚冲刺课程

  5. AI前奏必备-数据结构与算法课

  6. 深度学习-GAN专题论文研读(在学)

  7. 深度学习-GAN专题代码复现(在学)

  8. 10小时搞定LaTeX排版

  9. 大鹏教你玩数据

  10. 机器学习A-Z:全部五季课程

  11. 新版Linux视频教程零基础学习Linux

  12. 李明老师讲Linux

  13. 吴恩达机器学习

  14. Hinton机器学习与神经网络中文课程

 

如今2019年的新考纲就放在手边,考纲中继续保有四篇AIML论文。与一年前相比,我早已将忐忑之情甩在天边,吴下阿蒙成长为训练有素、兵强马壮。虽然现在我正在欢度两星期的寒假,每日却还在悠闲且高效地撰写2019年版Henry Liang's FRM Guide(FRM二级Current Issues部分)。

 

2月24日即将迎来新学期的FRM二级Current Issues课程,虽然课程只有短短6小时,届时我一定会体现出这一年来厚积薄发的学习成果,向大家展示一堂难忘的AIML课程。

 

接下去我向大家简单介绍一下2019年新考纲中四篇AIML论文。

 

=== 题材新颖,乐趣横生 ===

 

首先,这些论文毫不枯燥,反而乐趣横生。

 

某篇论文给出了泰坦尼克号1310名乘客的完整个人信息:包括姓名、年龄、性别、舱位、随行乘客人数、登船港、下船港、死亡与否、尸体袋编号、救生船编号、船票费用……随后用机器学习算法(决策树)让计算机自主学习哪些因素与乘客死亡密切相关。在2月24日的授课中,我会用Python当堂演示全过程——输入这些乘客的个人信息,让计算机学会并预测某一位乘客究竟是活下来还是葬身大海。

 

论文中还有一则案例:长期以来美国盛传房屋贷款的发放中存在种族歧视,即黑人更容易被不公正地拒绝给与贷款。这一次我们掌握了美国房屋贷款的数据,让计算机动用AIML算法,找一找究竟肤色会不会影响放贷结果?

 

通过在课堂演示这类有趣且小中见大的案例,我希望能让大家感受到FRM的美学与乐趣:FRM不等于背公式、题海战术、纸上谈兵——这些焚琴煮鹤的玩意儿,而是一套极具实战价值、且富有诙谐趣味的伟大体系。

 

=== 大数据与人工智能的联姻 ===

 

在21世纪的前十年,人工智能、机器学习这些名词并不代表时髦、前沿、高科技。那个年代(甚至直到2010年),AIML专业的毕业生几乎找不到工作。写“神经网络”的论文与写多元回归的论文一样,被视作夸夸其谈的垃圾,极难在顶级刊物发表,并且沦为“通不过论文答辩”的重灾区。

 

什么时候AIML变得如此火爆?应该是2010年之后“大数据”这根雷管引爆了AIML这颗炸弹。AIML的核心算法几十年前就已经定型且足够强大,只是苦于缺乏足量数据来拟合模型,并且缺乏强大的计算能力用来计算。“大数据”的兴起正好填补了“缺数据”的短板。

 

几十年来,各国当局一直受困于无法获知上网者的真实身份,很多国家因此纷纷推行“上网实名制”,用来监控上网者的行为,但是无一例外招致了民众的强烈抵触。

 

但是,现在“上网实名制”早已兵不血刃地全面实现了。每天清晨,我们用“滴滴打车”叫出租上班;白天用微信或钉钉讨论工作;中午用“饿了么”订餐;晚上用“淘票票”订电影票……这一切过程,我们无一例外且心甘情愿地用手机、姓名、住址、身份证、银行卡等实名信息注册。只要我们上网,无论通过电脑还是手机,都会产生大量数据——这就是大数据。这些海量数据对普通用户很琐碎,甚至毫无意义;但对情报机构、监察机构、别有用心的企业而言,却是千真万确、绝无造假、应有尽有的数据。

 

通过分析过去三年淘宝的购物记录,你的性别、收入、学历、家庭住址都能被识别,从而勾勒出你的基本形象。甚至谁是你的太太都无从隐瞒,因为你们分享同一个收货地址。电信公司通过实时监测手机信号的密度(每个人都随身携带一台手机),可以及时避免某个地区因人员过于拥挤而发生踩踏事故。蚂蚁金服在瞬间就能根据借款者的淘宝消费历史判断出其违约概率,并且在一秒钟内就决定向借款者发放数额恰当的贷款。

 

未来一旦这些看似孤立的网站——打车网站、购物网站、订餐网站、通讯网站——实施合并,你的全部生活就将无所遁形。

 

借钱时,你可能拿收入撒谎;相亲时,你可能拿婚史撒谎;求职时,你可能拿简历撒谎。但在大数据面前,你就是一个透明人。你无法对淘宝隐瞒你的资产;你无法对滴滴隐瞒你的行踪;你无法对饿了么隐瞒你的口味。

 

  • Big Data: New Tricks for Econometrics

  • On the Fintech Revolution

 

这两篇FRM考纲论文阐述的就是这样一个事实:在海量的大数据的支持下,AIML算法如鱼得水,通过强大的计算机运算能力挖掘出人类主观无法侦知的事物潜在规律。

 

=== AIML的局限性 ===

 

在AIML火爆的同时,我们发现:计算机智能还没有超出机械智能的范畴,机器学习不是“理解”而是“穷举”,是基于模拟人类神经网络的假设设计的不同学习方式、不同初始值等组成的系数矩阵。

 

阿尔法狗等应用的深度学习技术本质仅是神经网络的“权重调整”,计算结构并没有翻天覆地的变化。拨开层层面纱,AIML技术背后始终没有离开计算机科学那些经典的模型、范式和语言。

 

在AIML应用领域,目前看上去人类的步伐迈得又大又快。但我们也应看到:计算机科学CS的突破才是真正具有跨时代颠覆级能量的创新,而目前这一领域的创新进展还非常缓慢。

 

  • Machine Learning: A Revolution in Risk Management and Compliance?

 

这篇FRM考纲论文描述道:AIML在金融领域攻城拔寨的同时,依然存在严重的缺憾,比如其运算过程都是黑箱,无法解释,因而难以应对金融监管的要求。

 

=== AIML与传统统计学的融合 ===

 

人工智能产业蓬勃发展的最大隐忧在于:许多年轻学子已经被这股热潮冲昏头脑,他们不愿意踏实学习基础的计算机科学、数学,而是急于掌握各种现成软件工具的操作,因为“调参数”同样能够获得一些“看上去很美”的“成果”,同样能够在人才大战中收获高薪。

 

真正理解、掌握AIML技术背后的计算机、数学模型的人才凤毛麟角、万里挑一,绝大部分所谓的人才,无非只是熟练掌握程序软件,善于“调参数”罢了。但是真正要实现颠覆式的创新,没有扎实的根基如何获得巨大突破?

 

  • Artificial Intelligence and Machine Learning in Financial Services

 

这篇论文提出了先进的AIML应该与传统的计量经济学融合起来。两者既不是互相敌视,也不是互相取代,而是取长补短、共同发展。

 


 

Henry Liang, CQF

 Algo trader/quant

 IAQF会员 – International Association for Quantitative Finance

 金程教育资深级FRM/CFA培训师

 中国人事部认证CATTI二级交互传译

 中国翻译家协会会员

网站:www.HenryLiang.com

网易云课堂:http://study.163.com/u/henryliang

为何2019年FRM新考纲重点关注机器学习?_FRM_02