2019年 9月18日,第四届华为全联接大会开幕,华为首次发布计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局,计算产业新的大航海时代由此开启。同时,华为重磅发布了全球最快AI训练集群Atlas 900,加速科学研究与商业创新的智能化进程。

华为发布全球最快AI训练集群!1024颗昇腾910组成,总算力相当于50万台PC_大数据

算力超强 比原世界纪录快出10秒
据了解,Atlas 900由数千颗昇腾处理器组成,是当前全球最快的AI训练集群。
有多快?在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas 900只用了59.8秒就完成了训练,比原来的世界纪录快了10秒。

华为发布全球最快AI训练集群!1024颗昇腾910组成,总算力相当于50万台PC_机器学习_02

  • 全球最快的背后是1024颗昇腾910芯片,每块昇腾910 AI处理器内置32个达芬奇AI Core,单芯片可以提供比业界高出一倍的算力(256TFLOPS@FP16)。总算力相当于50万台PC计算能力。
  • 同时在片间互联和接口等方面,Atlas 900也全面做了提升,华为自研HCCS片间互联240Gbps,单端口速率在业界领先,最新的PCIE 4.0接口,传输速率为当前业界2倍。
  • 胡厚崑表示:Atlas 900的强大算力,可广泛应用于科学研究和商业创新。比如天文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原来可能花费好几个月的工作,现在交给Atlas 900,就是几秒钟的事情。
  • 胡厚崑举了一个天文领域的例子:在一片有20万颗星星的星云中,找出某种特征的星体,相当困难,一个天文学家需要耗费169天的工作量,才能完成这项工作。现在用上Atlas 900,只用10秒,就从20万颗星星中检索出了相应特征的星体。
  • 同时胡厚崑表示:目前Atlas 900的已经部署到了华为云上,并以极优惠的价格向全球科研机构和大学开放。

华为发布全球最快AI训练集群!1024颗昇腾910组成,总算力相当于50万台PC_大数据_03

现场演示中,在一张超过20万颗星体的南半球星图上,识别和定位具有一定特征的星体,运用Atlas900只用了10.02秒。而目前的方式是依赖‌经验的科学家,需要169天来完成该任务。华为轮值董事长胡厚崑说,目前Atlas900已部署在华为云上。

第一个特征,需要超强的算力。统计计算本身就是一种暴力计算,高度依赖于算力。举个例子,为了让计算机认识一只猫,就需要数百万图片的训练,这对算力的消耗是非常惊人的,面向自动驾驶、天文探索、气象预测等更复杂场景,对算力的需求将会更大。
第二个特征,计算和智能将会无处不在,而不仅仅是分布在中心侧。从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如耳机、手机,一起构成了未来智能时代的计算形态。
第三个特征,端边云之间需要高效的协同。中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。

华为发布全球最快AI训练集群!1024颗昇腾910组成,总算力相当于50万台PC_人工智能_04