自从GPT-3发布以来,大模型成为几乎所有全球头部AI企业的逐鹿目标。浪潮信息作为全球领先的AI厂商,也高举巨量模型的大旗,加速创新研发。在10月26日于北京举行的2021人工智能计算大会(AICC 2021)上,浪潮人工智能研究院宣布全球最大规模的中文AI巨量模型“源1.0”开源开放。

大数据ai多层技术架构图 ai大数据模型_big data

人工智能巨量模型“源1.0”由浪潮人工智能研究院于9月28日发布,是目前为止全球最大的人工智能巨量模型。据悉,它的参数量达2457亿,训练采用的中文数据集达5000GB,相比于美国的GPT-3模型1750亿参数量和570GB训练数据集,源1.0参数规模领先40%,训练数据集规模领先近10倍,荣膺世界第一。浪潮信息开源开放‘源1.0’旨在与更多的产、学、研、用单位和开发者一起,从技术创新、场景融合、应用开发等各个维度,共同促进巨量模型的健康发展与产业落地。

“源1.0” 开源开放计划将首先面向三类群体,一是高校或科研机构的人工智能研究团队,二是元脑生态合作伙伴,三是智能计算中心。面向第一类群体,“源1.0”将主要支撑在语言智能前沿领域的算法创新和方向探索;面向第二类群体,“源1.0”将主要支撑元脑生态伙伴开发行业示范性应用;面向第三类群体,“源1.0”将作为算法基础设施,与智能计算中心算力基础设施高效协同,支撑AI产业化和产业AI化发展。

“源1.0”开放开源计划项目包含开放模型API,开放高质量中文数据集,开源模型训练代码、推理代码和应用代码等。同时,浪潮信息将加强模型API和平台生态构建,开发支持高并发、高速推理的多种API接口,以支持各类用户对模型或功能的不同请求方式。并且浪潮人工智能研究院也将大力运营“源1.0”开源开放社区,建立完善的开发反馈机制并加快模型迭代。

目前,浪潮信息“源1.0”大模型只是一个开始,据浪潮人工智能研究院透露,“源2.0”的开发工作已经提上日程。在未来,浪潮“源”系列巨量模型将推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用,赋能实体经济智能化升级,促进数字经济高质量发展。