极智AI | 多场景覆盖看昇腾新推出的 Atlas300 系列新卡

原创

极智视界 2022-09-05 07:19:08 ©著作权

文章标签 人工智能昇腾 Atlas 昇腾710 深度学习 文章分类 前端开发

©著作权归作者所有：来自51CTO博客作者极智视界的原创作品，请联系作者获取转载授权，否则将追究法律责任

欢迎关注我的公众号 [极智视界]，获取我的更多笔记分享

大家好，我是极智视界，本文介绍一下昇腾新推出的 Atlas300 系列新卡。

2022 年，昇腾推出了新一代 Atlas300 系列卡，场景覆盖全面，包括 推理卡 ==> Atlas 300I Duo、Atlas 300I Pro，视频解析卡 ==> Atlas 300V Pro，训练卡 ==> Atlas 300T Pro。基本都会是对应上一代的升级：

推理：(原有升级) Atlas 300I ==> (up up) Atlas 300I Duo、Atlas 300I Pro；
视频解析：(新增) Atlas 300V Pro；
训练：(原有升级) Atlas 300T ==> (up up) Atlas 300T Pro;

1 推理卡系列

差不多两年前，昇腾推出了第一代 半高半长 的推理卡 Atlas 300I 以对标 Nvidia T4，从算力上来看 Atlas 300I 会逊色一截 (Atlas 300I 单卡 int8 算力为 88 TOPS，Nvidia T4 单卡 int8 算力为 130 TOPS，但跑实际网络的性能并不一定是这样)，Atlas 300I 长这样：

极智AI | 多场景覆盖看昇腾新推出的 Atlas300 系列新卡_昇腾

那时的 Atlas 300I 推理卡分型号：3000/3010，意思是区分 CPU处理器是 ARM 的还是 X86 的，两者不能互通，也就是说 你在华为自家鲲鹏机器上能用的卡，插在英特尔机器上是不能用的。而现在的 Atlas 300I Pro 是能很好的做到兼容 ARM 和 X86 ( 灵活度高了 )。

我们知道，Atlas 300I 卡内置 4个 device，芯片为 昇腾310，而 Atlas 300I Pro 直接升级到了 昇腾710，这也导致推理卡算力从原来的 int8 88 TOS -> int8 140 TOS (超越了 Nvidia T4，注: 这其实拿T4来比就不太公平了，现在T4都要停产了)。在工具链 (CANN 等) 方面，当然也在不断的升级，比如：以前的工具链前端是不直接支持 pytorch 的，这样灵活度会降低很多，因为现在用 pytorch 的人实在太多了，而现在早已支持 pytorch -> om 的部署路线 (记得前几年去华为参加讨论的时候还专门讨论过这个问题，当时的做法是必须先把 pytorch 模型先进行一次 模型转换，转成如 caffe 这样的 友好模型，然后可以转 om 部署，也可以再走一系列操作，如模型小型化啊、调优啊… 再到转 om 部署)。

这里实际拿 Atlas 300I 和 Atlas 300I Pro 对比会更有意义，因为这两个都是 半高半长卡，而 Atlas 300I Duo 则是 全高全长卡，因缺乏历史对比对象，这里暂且把它放在 Atlas 300I 和 Atlas 300I Pro 一起进行对比好了。下面是 Atlas 300I、 Atlas 300I Pro、Atlas 300I Duo 的一些主要性能参数对比：

指标	Atlas 300I	Atlas 300I Pro	Atlas 300I Duo
芯片	昇腾310	昇腾710	昇腾710
device 个数	4 个	4 个	8 个
算力 int8	88 T	140 T	280 T
算力 fp16	44 TF	70 TF	140 TF
显存	LPDDR4 32 GB	LPDDR4 24 GB	LPDDRX 96 GB
视频解码	80 路	126 路	256 路
视频编码	4 路	24 路	48 路
功耗	67 W	72 W	150 W

可以看到 Atlas 300I Duo 指标基本是 Atlas 300I Pro 的两倍，而 Atlas 300I pro 可以看做是 Atlas 300I 的 全方位升级 。

推理卡讲完了，看看 Duo 全高全长卡长啥样

极智AI | 多场景覆盖看昇腾新推出的 Atlas300 系列新卡_昇腾710_02

2 视频解析卡

新增视频解析卡 Atlas 300V Pro，先看参数再说吧：

指标	Atlas 300V Pro
芯片	昇腾710
device 个数	4 个
算力 int8	140 T
算力 fp16	70 FT
显存	LPDDR4X 48 GB
视频解码	126 路
视频编码	24 路
功耗	72 W

仔细一看，会发现个很有意思的现象：Atlas 300V Pro 指标中除了显存好像其他都和 Atlas 300I Pro 一样啊，你没看错，就是这样 ^ ^ 。Atlas 300V Pro 就是专门为 大容量、多路数 视频解析场景而生的，这种场景在安防领域十分常见。

极智AI | 多场景覆盖看昇腾新推出的 Atlas300 系列新卡_人工智能_03

3 训练卡

之前的训练卡是 Atlas 300T，现在升级到了 Atlas 300T Pro。Atlas 300T Pro 训练卡 (型号：9000) 是基于昇腾 910 AI处理器，为数据中心提供强劲算力的 AI 加速卡，单卡可提供超高 280 TFLOPS fp16 算力，能够加快深度学习训练进程。还是来看新、老卡的参数对比：