沈向洋院士：AI Agent时代，大模型产业落地的八个思考

原创

datian1234 2024-10-10 14:49:49 ©著作权

文章标签 人工智能语言模型 ai agi LLM 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者datian1234的原创作品，请联系作者获取转载授权，否则将追究法律责任

沈向洋院士：AI Agent时代，大模型产业落地的八个思考_人工智能

9月5日，香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在2024 Inclusion·外滩大会上分享了他对大模型产业落地的八个思考。他认为，AI Agent时代的到来，不会是一个神奇而强大的模型突然代替了所有工作流，它涉及技术、工程与市场的不断磨合，最终以超预期的服务呈现给人类。

思考一：算力是门槛

“今天做大模型，做深度学习，首先最重要的事情是要有算力。”沈向洋表示。他指出，从2010年开始，大模型需要的算力以6、7倍的速度增长。这几年稳定下来，大概每年有4倍的增长。模型越来越大，参数量越来越大，算力的需求也随着参数的增长，呈现出平方向的增长。

在他看来，整个计算机芯片行业的发展已经从原来的“摩尔定律”变成了“黄氏定律”。以前摩尔定律认为，算力每隔18个月增长一倍。如今预测，GPU将推动AI算力实现逐年翻倍。“讲卡伤感情，没卡没感情。以前有一句话叫贫穷限制想象力，现在贫穷可能扭曲想象力，因为如果没有卡，能想象要做的项目可能就不太一样了。”沈向洋感慨道.

思考二：关于数据的数据

公开资料显示，GPT3的训练数据达到了2个T的token（吞吐量），GPT4则达到了12个T左右。据沈向洋预判，GPT5的训练数据可能会达到200个T。目前互联网上的数据远远不能满足未来模型训练的需求，还需要思考用什么办法去挖掘更多的数据。

在人工智能领域，数据被视为模型的“燃料”，模型需要从这些数据中学习和提取有用信息。因此，数据的数量、质量和多样性都会直接影响到模型的准确性和性能。沈向洋表示，之前作为互联网最核心的积累，数据大多被谷歌用来做搜索引擎，以后这些数据都会被拿来训练大模型。“互联网40年积累的数据，好像就是为了这样一个AI时刻”。

思考三：大模型的下一章

下一步到底要干什么？沈向洋认为，大模型产业未来的发展路径已经非常明确，将会从之前的大语言模型，到多模态模型，未来迈向世界模型。从技术上讲，肯定要走理解和生成统一起来的道路。“未来一定会往具身智能方向上走，往机器人上面走，其中一个特殊形态就是自动驾驶。”沈向洋说道。

实际上，关于世界模型业内并没有形成一个标准的定义。OpenAI推出的Sora模型曾引发业内对“世界模型”的探讨。OpenAI将其视为能够理解和模拟现实世界的模型的基础，相信其能力是实现AGI（通用人工智能）的重要里程碑。然而，沈向洋认为，“Sora模型虽然做的非常好了，但还不是那么强大，里面的物理性质是不能保证的，做不到一个世界模型。”

思考四：大模型横扫千行百业

大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。沈向洋指出，通用大模型是AI的基础，要训练一个通用大模型至少需要万卡；行业大模型是做领域应用的底座，需要千卡级别的训练；企业大模型是企业数据价值的再发现，需要百卡级别的训练。这些大模型都对算力的要求极高。“最激动人心的是个人大模型，比如联想、微软在推AIPC和苹果的Apple Intelligence等都是朝着个人智能这个方向发展的。”沈向洋说道。

截至今年7月底，中国已备案大模型达到了197个，其中30%是通用大模型，70%是行业大模型。“可以看到，行业大模型占到绝大多数，未来肯定还会越来越多。”沈向洋表示。

思考五：AI Agent——从愿景到落地

2024年5月，微软公司创始人比尔·盖茨公开表示，AI Agent不仅会改变每个人与计算机交互的方式，还将颠覆软件行业，带来从键入命令到点击图标以来，最大的计算革命。

沈向洋对此观点表示认同。他认为，人工智能时代，真正了不起的超级应用就是AI Agent。AI Agent从愿景到落地的过程中，需要始终以需求为圆点，深刻理解模型的能力，并构建一个AI深度参与的工作流程。“今天在一家公司里工作的话，整个工作流是非常复杂的，ChatGPT虽然很强大，但远远没达到Agent的程度，它只实现了单点突破，真正要向前走还得融入整个工作流。”他说。

思考六：重视AI的****治理

AI治理非常重要。今年世界人工智能大会（WAIC）的主题就是在讲AI治理，各个国家对于这件事情的看法有很多不一样。AI的发展，对民众、公司、政府监管、社会发展等各个方面都产生了强大的冲击，引发了公众对于其安全治理的担忧。

“我觉得接下来人工智能的发展很重要的一点，从全球各个国家角度来讲，是一定要做主权人工智能，而主权人工智能背后一定需要有一个主权云来支持主权人工智能的发展。”沈向洋表示。

思考七：重新思考人机关系

“GPT带来的冲击有多少是人机交互的震撼，又有多少是机器智能的发展？”沈向洋认为应该重新思考人机之间的关系。他指出，AI为人类提供了与技术共生的全新语境，人机交互的新方式指向“AI与IA”的融合共进。IA（Intelligent Augmentation），即智能增强，代表着一种以人为本的 AI 发展路径。它聚焦于运用技术提升人类的能力，而非取代人类，强调了人类与 AI 之间的协作关系。

“纽约时报专栏作者John Markoff 提到，计算机过去几十年的发展路程里，真正的赢家是做人机交互的。不管是什么技术，最后的目的都应该是帮助人类更好地使用机器。”沈向洋表示，“到了AI时代，人机交互最本质的是对话，就像ChatGPT这样。ChatGPT加上微软，会不会成为AI时代最伟大的公司？我想只有时间才能够验证。”

思考八：智能的本质

今天，GPT的发展如火如荼，但实际上，人们对智能的理解还是非常有限的。不同于物理学，上到浩瀚的星空，下到微小的量子，都能有一个大一统的理论可以解释；今天的深度学习很多东西都是不可解释的，没有鲁棒性。

“智能的本质是神经网络与符号系统的世纪之争。”沈向洋说道，“今天，虽然人工智能的发展还处在一个相对来讲比较早期的阶段，但是行业上已经有很多的应用，值得下定决心去做，我对未来的发展充满信心。”