2020-12-12 16:47:41
作者 | 陈彩娴
2008年,窦志成正式入职微软时,导师文继荣在发给全组的欢迎邮件里写道:“Zhicheng is good at writing: writing papers and writing codes.”
十多年过去,无论是在微软亚洲研究院担任研究员,还是追随文继荣入职中国人民大学,窦志成仍然保持动手写代码的兴趣,丝毫不亚于写论文:“有空闲时间的时候,就想写点代码。”
入职人大后不久,他一个人动手开发了时事探针系统。2020年疫情期间,又自己动手做了让学生和教师上报数据的可视化分析系统。
作为一名教授,这显得有点不太“正常”。但作为一个从微软出来的学者,编程好也许是研究人员必备的基础素质之一。正如沈向洋担任微软亚研的院长期间所提出的,一个合格的研究人员应该是“三好学生”:数学好、编程好、态度好。
从企业转到高校,就像过去人生中的许多重要转折点一样,窦志成并不是刻意追求,而是顺其自然。但他对凡事均竭尽全力,总能在看似被动的经历中取得佳绩:在过去的六年里,他先是担任人大信息学院特别研究员,随后被破格晋升为教授,如今又被任命为人大高瓴人工智能学院副院长。
“我希望培养出既精通人工智能技术,又具有人文关怀精神的学生。” 问及为何选择在人大做AI时,窦志成这样答道。
1 到南开读计算机,是误打误撞
位于河北省承德市的平泉一中先后出过8名市状元,1999年更是摘得文理双魁。窦志成便是那一年的理科状元。
谈起当年辉煌战绩,窦志成的反应很平静:“高考那几天特别放松,其实当时没想到能考承德市第一。”
事实上,作为一路拔尖的学霸,从小学到初中、高中,甚至是大学,窦志成的学习成绩一直名列前茅,稳扎稳打。但高考后,窦志成没有选择报考清北,而是去了南开读计算机。
当时,学校里负责为学生提供报考意见的老师跟他说,前一年的承德市状元去了南开大学读计算机,体验非常好。
那时候,计算机刚刚起步,周边人一致认为这个专业很有前途。作为理科生,窦志成的内心对前沿技术自然十分向往,于是便报了南开大学信息技术科学学院计算机专业。
结果,窦志成去了南开后才发现:“那个师兄报的不是计算机,而是国贸专业。”真是误打误撞。
更让窦志成没有想到的是,因为一个“信息不对称”,他将在南开度过最宝贵的九年时光:本科、保研、转博,成为一名中国“土生土长”的计算机博士,重点研究领域还是信息检索。
图注:百年名校南开大学
尽管学习成绩名列前茅,窦志成并不是闭门造车的学霸。相反,他觉得当时的计算机课程有些枯燥,于是从大二开始,便利用课余时间自学,做些小游戏、个人网站、通讯录等能看得见的小东西。这增加了他对编程的兴趣。新出来的编程语言(2002年,微软.NET 2002和C# 1.0面世),他也迫不及待地第一时间去学习和使用。
窦志成对代码的热爱,便是在那段时期培养起来的:“课上所学习到的知识毕竟有限,如果不主动去拓展自己的知识面,怎么能脱颖而出?” 在后来的学术生涯里,他身兼数职,也经常教导学生不要拘泥于自己研究的小领域,要敢于突破自己,想来是同出一脉的。
在本硕期间,除了学业,窦志成花心思最多的便是写代码、搞工程开发,先后负责了多个办公系统、进销存系统、项目管理系统、采办一体化系统的开发。
“这个过程我很Enjoy,因为能够不断自我学习和成长,从来没有觉得辛苦。”
令窦志成印象十分深刻的是第一次做项目的经历。
大三下学期,他在前辈的带领下为一个企业做协同办公系统,基于他们所搭好的框架与模板进行开发。但没做两天,他发现师兄前期做的框架和界面都存在很多问题。于是他便偷偷推翻了师兄原有的方式,私下按照自己的的想法,对整个后台数据库、框架以及界面设计进行了改造和升级。
后来“东窗事发”,师兄发现后,遭到了一顿乱喷。意外的是,他的方案获得了实验室老师与项目甲方的认可,被委以重任,反而在后续工作中主导了整个项目的核心设计和开发。
那时,他并没有想过做科研,考虑更多的是积累项目经验,将来毕业好找工作。但“无心插柳柳成荫”:
做项目的过程中,窦志成被同一个办公室的师兄发现并推荐到了袁晓洁老师的课题组,之后被保研并读博。
研一暑假,窦志成留在学校为滨海学院开发一套包括日常教学管理、选课排课、线上学习与作业等众多功能在内的教学教务管理系统。在这个过程中,他偶然结识了一位暑期也留在学校做项目的师兄。2005年,这个师兄去了MSRA实习,因为组里在招实习生,窦志成因优秀的业务能力得以被推荐。
“感觉好多事情就是一个自然而然的过程,从没有主动去争取过什么。”
2 微软亚研9年:追求技术梦想
自2005到2014年,窦志成在微软一共工作了9年时间。而他的Manager,正是现任中国人民大学高瓴人工智能学院执行院长的文继荣。
微软亚洲研究院(Miscrosoft Research Asia,简称MSRA)成立于1998年,是微软在海外设立的首个研究院。当时,国内类似的研究机构寥寥无几,聚集了大批国内高校博士生与海归,是全国高校学子向往的地方。
图注:微软亚洲研究院
和当时其他计算机专业的学生一样,窦志成也被微软的企业愿景和文化氛围深深吸引。微软所做的操作系统与软件有非常庞大的全球用户量,“做的事情可能会被上亿用户使用,感觉比产出论文更有价值,就觉得未来还是想在这个行业里做一些很有价值的事。”
机缘巧合之下,2006年6月份,窦志成从原来实习的部门转到了文继荣领导的互联网搜索与挖掘组,之后便一直追随文继荣,从事信息检索相关的研究。
实习期间,窦志成主要研究信息检索排序与个性化搜索。比如搜“苹果”这个词,系统能根据历史记录,判断出该用户想搜的是苹果公司,而不是水果,进而为用户返回个性化的更符合用户需要的信息。而这个研究题目,窦志成延续至今。
“未来,如何有效的理解用户,为用户提供个性化的精准信息服务,让每个人能有一个个人智能信息助手,会是人工智能领域重要的任务之一。”
因为实习期间表现出色,加上在文继荣小组所做的搜索引擎项目是微软内部比较看好的研究方向,2007年,窦志成被MSRA选为优秀实习生,有幸到美国进行了5天访问。
年代久远,再回忆当年,窦志成仍能十分肯定地说:“当时很兴奋!” 一是有机会开阔眼界并且能和比尔盖茨面对面沟通,二是体验了美国尤其是微软的文化氛围。
除了去比尔·盖茨位于华盛顿湖边的豪宅作客,优秀实习生还有机会与美国高校的知名教授、微软的高级研究员进行深入的沟通与交流,期间还去了波音公司参观:“我们当时看到一架非常庞大的飞机在组装,还讨论:到底是组装一架飞机的工程难度高,还是做一个操作系统工程的难度高?”
美国之行给窦志成留下了很深的影响。于是,博士毕业后,窦志成便一心奔着MSRA去,校招期间只投了MSRA一家企业,最后顺利拿到了offer。
在MSRA工作的几年,正是信息检索领域的黄金期。商业搜索引擎鼎盛,全球顶级的学术会议,一大半都是微软、雅虎、Google 的论文,也吸引了大量的老师、学生都在研究互联网搜索引擎。
和当时一般的高校实验室以发论文为主的目标不同,文继荣带领的互联网搜索团队更注重成果的实用性。他带领整个团队与产品组合作,去做搜索引擎的基础框架、技术平台、实验平台等。窦志成参与研发的多项技术也在Bing、Office等产品中得到应用。
谈起当时的这种工作方式,窦志成感触很深, “在这个过程中,对整个搜索引擎系统都了解得非常深入,我们的目标是解决大问题,而不是扑在上面的一个小问题做一两篇研究论文。”
3 加入人大:投身教育
2014年,窦志成离开微软,应文继荣教授的邀请,来人大任职。
谈及离开微软的决定,窦志成直言不讳:“微软亚洲研究院是我的第一份工作,其实当时选择在微软工作的时候,没有想到自己有一天会离开。我对微软的感情很深。一方面是喜欢里面的科研环境,另一方面是喜欢里面的员工关系。” 而后者,显然是对导师文继荣的感情,也是他离职微软、加入人大的最重要因素之一。
在窦志成的眼里,文继荣的人格魅力很强大,主要体现在两点,一是自由,二是关怀:
“文老师最大的特点是宽容。他相信每一个人,相信只要给你提供环境,让你选择自己感兴趣的探索方向,就一定能做出好的成果来。
“当我们遇到问题时,无论大小,文老师也总是会想尽一切办法来帮我们。他会让你觉得很温暖。”
图注:文继荣、窦志成团队成果入选”砥砺奋进的五年”大型成就展
这与高瓴人工智能学院(GSAI)的建院基调是一致的:无论招聘教师,还是培养学生,窦志成认为,提供学术自由与人文关怀都是培养社会栋梁的两大要素。
问及从企业到高校的生活转变,这位在企业工作了九年的科研者说了句心里话:“跟在微软相比,我们现在太累了。”
他调侃自己是一名青年教师,又称为“青椒”,具有很强的奋斗心与内在驱动力,而“椒”字又有焦虑的意思,因为在高校要承担的责任更大:上课,做科研,指导学生,承担学院的部分管理工作,比互联网公司里的996要辛苦得多。
但窦志成认为,和工业界的研究院相比,能够言传身教,手把手的培养学生,为社会培养人才,是更有价值和意义的事。因此,当GSAI筹建时,窦志成便毫不犹豫地加了进来。
GSAI由高瓴资本出资,从2018年年底开始筹备建院,窦志成是最早参与建院的成员之一,也是现任副院长。
问及在人大建立人工智能学院的主要挑战,窦志成认为,建院的困难在于学院的定位与起点很高。
GSAI的目标是要建立世界一流的人工智能专业,在此基础上推动人工智能与优势人文社科专业的跨学科合作与发展。在机制体制上,和人大现有的教师评聘制度制度不同,GSAI采用国际长聘教轨制(Tenure Track),鼓励教师产生高水平成果。
“成立一个新的学院,尤其是成立一个有特色的、高起点的、高水平的学院,就像是一个创业的过程。这个过程是个探索的过程,会遇到各种各样预想不到的问题,没有任何经验可以借鉴。”
令窦志成欣慰的是,尽管十分辛苦,但在与文继荣及其他团队成员的合作下,目前所有工作都已经稳步有序地开展。
GSAI于2019年4月22日正式成立,第一批教师已经到位,第一批硕博已经到位,第一批本科生已经到校,先经过一年的大类培养,在大二选学院时便能正式进入GSAI学习。
图注:GSAI首批教师
尽管成立不过一年左右,GSAI在AAAI、SIGIR等国际顶级会议上取得了不错的学术成果。2020年,由GSAI教授参与合作的31篇论文被CCF-A类会议录用,其中信息检索顶级国际会议SIGIR 2020的论文有8篇。
4 GSAI:做有温度的AI
图注:窦志成主持高瓴人工智能学院2020年夏令营开营仪式
在制定GSAI的培养方案时,窦志成清晰地表达了自己的愿景:“我们希望培养出既精通AI技术知识、又具有人文关怀的跨界人才。”
在窦志成看来,“有温度的人工智能”包含两个层面的含义:
一是学生了解整个社会的运行机制,在研究人工智能的技术和算法时,能够更好地去设计和实现这些技术,推动社会的良性发展;
二是学生要考虑人工智能的伦理安全,有人文关怀,将人放在人工智能系统中的重要位置。
他举例:“如果学生将来研究一门算法,可能会暴露用户隐私的算法,我们希望他们会思考:做出某项技术,从短期来看可以吸引一些用户,但会不会潜在对用户造成隐私甚至是人身安全的侵害?”
因此,GSAI的本科培养方案以人工智能专业为核心,增设了许多跨学科交叉课程,比如AI+法律、AI+经济、AI+新媒体等,并鼓励学生选修部分人文社科专业的基础课程。
在招聘教师时,GSAI也看重教师的跨学科背景,如计算机与经济学、AI与物理、AI与城市治理等。
事实上,在调去GSAI之前,窦志成便是在AI与人文社科间搭建桥梁的践行者。2017年,当时他还在信息学院任教时,便开设了一门面向全校(尤其是人文社科专业同学)的选修课《大数据分析导论》。
“我们之前去跟企业合作,企业的管理者听说大数据很火,就说能帮我们分析某一块数据吗?我们的第一直观回答是:你打算分析哪些方面、想带来什么价值?但他们给不出需求,因为不知道现有的模型和数据能干啥。”
有感于两者之间的孤立隔绝状态,窦志成便与文继荣着手,从本科开始培养人文社科的学生,掌握基本的大数据分析算法和工具的使用方法,这样他们走上工作岗位后,至少了解AI的应用,跟AI专家合作时有共同语言。这门课吸引了很多优秀的学生。
在人才培养上,高瓴人工智能学院还特别强调学生的实践能力的培养。目前,GSAI已与字节跳动、百度、美团点评、爱奇艺、滴滴、华为等近30家人工智能相关企业签订了实训基地协议。
图注:窦志成带领学生参访字节跳动
GSAI也重视培养学生的国际视野,其中一个途径便是与海外知名高校建立合作关系。比方说,2019年12月,GSAI与加拿大蒙特利尔大学计算机科学系(UdeM)建立合作伙伴关系,实施“双博士学位” 项目:
“我们希望学生不仅有机会学到人工智能领域的先进知识,还能够和世界上一流的专家对话,有机会去国外深造。”
5 结语
像当下许多青年教师一样,窦志成希望自己可以自由地行走在高校与企业之间,教学与实践相得益彰。
如今,他不仅担任GSAI的副院长,还担任北京智源人工智能研究院“智能信息检索与挖掘”方向项目经理, 基于大数据文科综合训练国家级虚拟仿真实验教学中心执行主任。
回首以往的人生,他总结自己更像是一个随遇而安的人。无论是高考理科状元,选择南开大学,保研、直博,进入微软做研究,到后来加入人大,他几乎没有因为选择费心思,说做就做。
窦志成认为,要把时间花在执行上而不是选择上。与其在选择上浪费很多时间,还不如顺其自然地接受直觉上合理的选择,把每个已经选择了的事情执行好。
“其实完全没有必要为每一个选择后悔,因为你不知道选择了另外一条路会是怎样的景色。努力去做就对了!”