NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍

30系显卡买不到?英伟达老黄刚刚又发布一款“空气CPU” 。
不过就算你抢不到也没关系 , 因为这款CPU专门为服务器设计 , 到2023年才能发布 。
刚刚 , 在英伟达举办的GPU技术大会上(其实会场就是老黄家的厨房) , 黄仁勋发布了全新ARM架构CPU , 也是英伟达首款服务器CPU——Grace 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
这款CPU专为处理大量数据的AI任务而生 。老黄说 , 如果服务器用上这款CPU , 那么AI性能将超过x86架构CPU的10倍 。
去年 , 老黄就是在这里发布了A100、RTX 30系列GPU 。今年 , 这位皮衣男的头发更长了 , 也更白了 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
除推出首款服务器GPU外 , 英伟达还要把ARM架构带到笔记本上 。
如果用一句话概括这场发布会 , 那就是老黄想用ARM革x86的命 , 毕竟英伟达是准备用400亿美元收购ARM的 。
PPT级CPU
全新的CPU以女程序员先驱Grace Hopper的名字命名 , 有趣的是英伟达的GPU是以男性科学家的名字来命名的:图灵、安培……现在英伟达的两条产品线实现了梦幻联动 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
RTX 30系显卡是因为买不到而被叫做“空气” , 那么Grace CPU被叫做空气的原因是 , 这款产品实在是“太PPT”了 。
正式发布时间在2年后 , 什么整数浮点运算性能、主频参数统统没有 , 连制程工艺也语焉不详 , 如果不出意外 , 应该是5nm 。
英伟达只在发布会上透露 , Grace在SPECrate2017_int_base基准测试中超过300分 , 可以与AMD第二代64核EPYC中的某些CPU相媲美 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
再看看这一个月里AMD和Intel发布的服务器GPU那一大串参数 , 这不就是“空气”吗!
既然什么参数都没有 , 唯一参数也只和AMD上一代ETPC持平 , 老黄为何敢拍着胸脯说Grace比其他x86架构强10倍呢?
【NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍】因为 , 在数据传输速度这件事上 , Grace比AMD和Intel跑得快多了 。
这对于AI任务太重要了 。英伟达的GPU用于深度学习 , 而CPU、内存和GPU之间的通信速度往往拖了AI的后腿 。
过去 , CPU和GPU之间靠PCIe总线进行数据传输 , 两种不同架构硬件之间的沟通太慢 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
而x86架构CPU又不支持英伟达自有的NVLink , 所以最好的办法是自己造一个CPU , 专门为大量数据的AI任务而生 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
Grace和英伟达GPU之间通过NVLink 4进行通信 , 从GPU到CPU之间的传输速度高达900GB/s , 比AMD EPYC 2+NVIDIA A100的搭配快14倍 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
△ Grace与AMD CPU传输速率对比(图片来自AnandTech)
另外 , Grace也有着最高的内存带宽500GB/s , 且支持LPDDR5x ECC内存 , 能效比其他产品高10倍 。
这款CPU我们何时才能见到呢?
现在已经有两个大客户了 , 其中瑞士国家计算中心正在建造全球最快AI超算算力达20EFLOPS;美国洛斯阿拉莫斯国家实验室也将为其研究人员配备搭载Grace的新AI超算 。
NVIDIA|英伟达发布“空气CPU”:ARM架构 性能超X86十倍
文章图片
至于Grace的一个可能用途 , 是用来训练下一代超过1万亿参数的NLP模型 , GPT-4就靠它了 。
ARM笔记本也能有独显
取代x86的野心不仅在服务器端 , 英伟达还要把ARM带到PC平台上 。


推荐阅读