文章目录
- 斯坦福 2022 年 AI 指数报告精读
- 1. 简介
- 2. 报告内容
- 第一章 论文专利情况
- 发表国家划分
- 跨国合合作情况
- 中国霸榜AI顶会,但引用量最低
- 第二章 技术的进展
- 计算机视觉
- 自然语言处理
- 推荐系统
- 强化学习
- 硬件
- 机器人
- 第三章 人工智能伦理道德
- 第四章 人工智能市场经济和教育
- 第五章 人工智能政策和政府导向
斯坦福 2022 年 AI 指数报告精读
报告链接 :https://aiindex.stanford.edu/report/
视频链接:https://www.bilibili.com/video/BV1s44y1N7eu 感谢李沐导师!!!
笔记来源:斯坦福 2022 年 AI 指数报告精读【论文精读】 - 哔哩哔哩 (bilibili.com)
1. 简介
斯坦福2022年AI指数报告精读,报告是由斯坦福下的一个机构HAI
撰写
全称是以人为中心的人工智能,虚拟机构,是一个由李飞飞老师和另一位斯坦福做逻辑的老师共同建立
从2017年开始每年发布一个AI指数报告,今年第5期,2020年未发布,覆盖面比较广230页
2022 AI Index 报告共分为五个部分,具体如下:
- 第一部分:研究与开发(Research and Development)
- 第二部分:技术性能(Technical Performance)
- 第三部分:技术 AI 伦理(Technical AI Ethics)
- 第四部分:经济与教育(Economy and Education)
- 第五部分:AI 政策与管理(AI Policy and Governance)
以下是8个重点内容。
- 2021年私人投资在AI上增加很多,将近1000亿美金投资,比2020年多1倍,投资更加集中
- 中美跨国研究合作最多
- 语言模型更强也更有偏见
2018年bert1亿参数,2021年2800亿参数模型生成出来的那些带有偏见的有毒的结果增加了29%,因为大模型使用更大的数据,这些数据不像小数据那么能够给你精心准备,而且大模型更容易把大数据里带有偏见的一些东西显现出来- AI伦理文章越来越多
- AI变得越来越便宜,性能越来越高
训练一个图片分类器的开销从2018年到现在相比的话下降了3.6%,训练的时间缩短了94.4%,这是因为gpu做的越来越大了,如果不计算挖矿导致的GPU价格升高的话,其实他的成本是往下降的,而且我们现在能够用更大的集群,用更好的算法能做分布式的训练,所以它的整体计算时间是下降的- 在报告的10个数据集上面,9个数据集最好的方法用了额外的数据
- 基于实验室基准条件的模型技术结果则越来越依赖于使用更多的训练数据来获得更先进的结果。换言之,模型本身的设计好坏往往差别不大,而更多的训练数据能带来更好的实验效果。
- 截至 2021 年,斯坦福大学AI指标报告中的 10 个基准测试中有 9 个最先进的 AI 系统经过了更多的训练。这种趋势隐隐指引着私营参与者倾向去寻找大量的数据集。
- 在全球范围内关于AI的立法也越来越多了
- 机械臂变得越来越便宜了,在2017年平均一个机械臂的价格是4万美金,现在基本只要一半的价格
技术发展曲线
刚刚冒出来-做大做便宜-更安全很多突破性工作已经做出,这两年没有很大突破性工作
2. 报告内容
第一章 论文专利情况
过去11年AI相关论文的个数,现在一年30万篇,很多是同学们的练习题
99%的文章可能是没有太多意义的,一年读50篇已经是非常好了
发表国家划分
美国情况
中国情况
跨国合合作情况
中美科学家合作写论文的数量
其他国家合作情况
中国霸榜AI顶会,但引用量最低
2021年,中国在人工智能期刊、顶会和知识库出版物的数量上继续领先世界。这三种出版物类型的总和比美国 高出63.2% 。
与此同时, 美国在人工智能顶会论文数量和存储库引用的数量上处于领先地位 。
就AI期刊论文发表数量来看, 过去12年人工智能期刊论文发表数量占比,中国始终霸榜 ,2021年为31.0%(2020年占比18.0%),其次是欧盟和英国,为19.1%,美国为13.7%。
2021年,中国在AI期刊的全球引用量依旧领先。
值得注意的是,不论是AI期刊论文发表数量、引用数量,美国从去年第2名降至第3名。
那么中美在顶会发表论文的情况如何?
2021年, 中国以27.6%的比例在全球AI顶会发表的论文数所占份额最大 ,比2020年的领先优势更大,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。
然而,美国一直在AI顶会论文引用量上居高不下,2021年引用总量占比29.52%,排名第2和第3的分别是欧盟英国(23.32%)和中国(15.32%)。
中国从去年第2名跌倒第3名,从侧面可以看出, 中国论文发表数量最多,但质量不如美国高 。
总体来看,2021年人工智能专利申请量是2015年的30多倍,年复合增长率为76.9%。
具体讲,中国申请了全球一半以上的AI专利,并获得了约6%的授权,与欧盟和英国大致相同。
与不断增长的人工智能专利申请和授权数量相比,中国的专利申请数量(2021年为87343件)远高于授权数量(2021年为1407件)。
最受欢迎GitHub开源库:TensorFlow
从2015年至2021年GitHub开源AI软件库的用户数量可以看出,TensorFlow仍然是2021年最受欢迎的,GitHub累计星数约为161,000,比2020年略有增加。
排在第2名的便是OpenCV,紧随其后的是Keras、PyTorch 和 Scikit-learn
第二章 技术的进展
讲了以下内容的数据
计算机视觉
- 图像分类
- 图像生成
- deep fake
- 人的姿态估计
pck
Human3.6M - 语义分割
- 人脸检测
- 视觉推理
- 行为识别
- 物体检测
- 视觉常理
自然语言处理
- 语言理解
- 文本的摘要
- 自然语言推理
- 拓展推理
- 情绪识别
- 语言翻译
- 语音翻译
推荐系统
- 广告点击推荐
强化学习
- Atari-57
- 下棋
硬件
机器人
- 机器手臂
第三章 人工智能伦理道德
- 大型语言模型在技术基准上创造了新记录,但新数据显示更大的模型也更容易从训练数据中产生偏差(bias)。 2021年开发的2800亿参数模型与2018年最先进的 1.17 亿个参数的模型相比,其诱发偏差增加了 29%。随着时间的推移,这些系统的能力一定能够显着增强,同时也会带来模型产生训练偏差的严重后果。因此认为这类语言模型还有待研究。
- 人工智能伦理的兴起变得无处不在:自 2014 年以来,关于人工智能公平性和透明度的研究呈爆炸式增长。在人工智能伦理相关的会议上,相关出版物增加了五倍有余。算法的公平和偏见已经从单纯的学术追求转变为成为具有广泛影响的社会主流研究课题。工业界研究人员近年来在以伦理为重点的会议上贡献的出版物同比增加了 71%。
- 多模态模型学习多模态偏差:在训练多模态语言视觉模型方面取得了快速进展,这些模型在联合语言视觉任务上表现出新的能力水平。这些模型创下了有关图像分类和从文本描述创建图像等任务的新记录,但它们也反映出社会刻板印象和偏见——对CLIP的实验表明,黑人的图像被错误分类为非人类的比率是任何其他种族的两倍多。虽然研究者已经开发了许多衡量计算机视觉和自然语言处理系统偏见的指标,这依然强调了对洞察多模态模型偏差的指标需求。
第四章 人工智能市场经济和教育
- 2016 年至 2021 年的5年间,新西兰、香港、爱尔兰、卢森堡和瑞典是人工智能方向人才招聘增长最快的国家或地区。
- 2021 年,加利福尼亚、德克萨斯、纽约和弗吉尼亚是美国人工智能职位发布数量最多的地区,加利福尼亚的职位发布数量是位居第二的德克萨斯的 2.35 倍以上。与职位发布的总数相比,华盛顿特区的 AI 职位占比最高。
- 2021 年人工智能领域的私人投资总额约为 935 亿美元,是2020 年私人投资总额的两倍多。新获投资的 AI 公司数量持续下降,从2019 年的 1051 家公司、 2020 年的 762 家公司(同比下降27%)、到 2021 年的 746 家公司(同比下降2%)。2020 年一共有 4 项融资的价值超过5亿美元;2021年有15个(同比增加275%)。
- “数据管理、处理和云”在 2021 年获得了AI方向最大规模的私人投资,是2020年投资额的2.6倍,其次是“医疗保健”和“金融科技”。
- 2021 年,美国在人工智能领域的【私人投资总额】和【新资助的企业数量】均领先世界,分别比排名第二的中国高出三倍和两倍。
- 据麦肯锡称,关于在工业中使用人工智能产生的相关伦理问题的讨论仍然有限。29% 和 41% 的受访者认为“公平与公正”和“可解释性”是AI应用的风险,仅 19% 和 27% 的人正在采取措施降低这些风险。
- 2020 年,每 5 名获得博士学位的计算机科学系学生中就有 1 名是研究人工智能专业/机器学习专业,这使得人工智能相关专业成为了近十年来最受欢迎的专业。从 2010 年到 2020 年,大多数 AI 美国博士投入了工业,而很小一部分人则从事政府工作。
第五章 人工智能政策和政府导向
- 对 25 个国家人工智能立法记录的指数分析表明,包含“人工智能”的提议被通过而成为法律法条的情况,从 2016 年的 1 个增加到 了2021 年的 18 个。西班牙、英国和美国在 2021 年通过的与人工智能相关的法案数量最多,这些国家都通过了三项。
- 美国的联邦立法记录显示2015 年到 2021 年拟议与人工智能相关法案的总数急剧增加,而通过的法案数量仍然很低,最终只有 2%的法案成为法律。
- 2021 年,美国的州立法者在每 50 项包含 AI 条款的拟议法案中就会有 1 项通过,而此类提案的数量从 2012 年的 2 个增加到 了2021 年的 131 个。
- 在美国,第 117 届(本届)国会会议有望创下自 2001 年以来最多与人工智能相关的提及。到 2021 年底会议进行到一半已有 295 次提及相关话题,与上一届(第 116 届)国会会议整体提到了 506次相比。
参考资料
【报告】2022斯坦福AI指数报告出炉!中国霸榜AI顶会,但引用量最低(附PDF下载)_RAD极客会-商业新知 (shangyexinzhi.com)