作者:张国斌
随着去年搭载 Arm 架构处理器的日本Fugaku 超级计算机荣登全球超算 TOP 500 榜首,彰显了Arm架构在高性能计算领域的潜力。其实,Arm早就想进入高新能计算领域,早在2019年,Arm推出了2个瞄准高性能计算的全新平台——Neoverse N1和Neoverse E1,Neoverse N1面向高性能设备,这是平台名称,与之对应的CPU核心架构名称也一样——Neoverse N1处理器。平台包含处理器、总线、多核心系统等。Neoverse N1和相对应的处理器代表了ARM首款专为服务器和基础设施市场设计的专用IP,Arm面向消费市场以Cortex系列为主,面向行业客户则由Neoverse披挂上阵。
而且Arm公司对Neoverse的未来也有规划,就是在2021年推出5nm工艺品台,如下图所示:
今天,Arm公司兑现承诺,推出两个新的升级平台,分别是Arm Neoverse V1和Neoverse N2以及用于它们的网状互连技术,其中,V1是一个全新的产品,N2则是N1的升级版,它们是Arm的下一代通用计算平台,旨在跨越从超大规模云到智能网卡和运行边缘工作负载的用例,N2也是第一个基于Armv9架构设计的平台。
据Arm基础设施事业部高级副总裁兼总经理Chris Bergey介绍,Arm Neoverse V1 平台是 Arm 新型计算系列的第一个平台,也是 Arm 设计的首款支持可伸缩矢量扩展(SVE)的内核,可为高性能计算与机器学习提供 50% 的性能提升,Arm Neoverse N2 平台是第一个基于 Armv9 架构的平台,可为多样工作负载提供 40% 的性能提升;Arm Neoverse CMN-700 是业界最先进的 mesh 互连技术,能充分发挥 Neoverse V1 和 N2 平台的性能与每瓦性能优势。
高性能计算呼唤新的架构
回顾的处理器的发展历程,正是伴随着数据处理的发展而发展,高性能计算(High-performance computing,HPC)是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。
正是通过数据处理,我们才得以实现开创性的科学发现,推动改变游戏规则的创新,并提高全球数十亿人的生活质量。HPC 是科学,工业和社会进步的基础。 科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业都涉及高性能计算集群来解决大型计算问题。
随着物联网 (IoT)、人工智能 (AI) 的发展,全球数据呈现指数级暴涨,而且在端边主要采用的是基于Arm 架构的处理器,如果云端载采取Arm 架构,则对数据处理的效率有很大提升,尤其是云原生概念的提出,更是加大了Arm 架构处理器在HPC领域的落地。
所以,高性能计算领域呼唤新的架构,新一代面向HPC的计算架构需要更加开放才能产生更好的创新,新一代CPU不能有传统的制约因素。HPC需要处理器具备确定性、可预测性的性能表现,使服务实现最低延时还有跨平台的可扩展性以及高能效及部署密度这些需求让Arm 架构处理器在HPC领域找到了用武之地。
Chris Bergey指出使用Arm Neoverse N1平台的AWS Graviton2实例的性价比比以前的传统实例高40%。而业界首个基于Arm Neoverse N1平台的80核服务器处理器Ampere Altra在提供其客户所需的每瓦性能、灵活性和可扩展性方面表现突出,甲骨文公司最近宣布,计划从2021年初开始将基于Ampere Altra的产品引入甲骨文云。
所以Arm 的 Neoverse V1和Neoverse N2 甫一推出就受到了客户的欢迎,亚马逊、阿里巴巴、腾讯、微软等表示了支持和肯定。
阿里巴巴首席工程师周经森(Kingsum Chow)表示一年之前,我们就跟Arm的员工一起合作,把java虚拟机的性能提高。过去一年里,我们把现有一些Java应用的一些性能提高了50%。
腾讯专项测试技术中心总监黄闻欣则表示去年腾讯和Arm正式签署了一份合作协议,通过合作加速Arm Neoverse技术的测评和适配。通过测试腾讯发现Arm服务器比传统的服务器性能表现更强劲。尤其在AI推理和图片处理领域优势非常明显。
Chris Bergey指出Neoverse平台在某些方面有点像爱迪生的电灯泡。它提供了以前以不同形式存在的东西(就爱迪生的发明而言,就是光),但它以一种更有效和可扩展的方式从根本上改变了行业。
而且他引申指出考虑到灯泡革命后,一旦电源插座和灯泡底座的触点被标准化,电力照明市场不仅蓬勃发展,而且技术上的共同点为其他电力驱动的电器,从烤面包机到冰箱等开辟了一个巨大的新规模。
“正是这种标准化精神促进了可扩展性,导致我们最近通过卡西尼项目扩大了Arm Neoverse平台的价值。卡西尼项目是一项开放的合作计划,聚焦三个方向进行开展——平台标准和参考实施、边缘安全性以及云原生堆栈,旨在确保整个Arm边缘生态系统的云原生软件体验。”他强调。“对于芯片合作伙伴、ODM、OEM、ISV和最终用户来说,"卡西尼项目 "通过加速部署多样化的、工作负载优化的Arm平台,开启了边缘计算的机会。”
他以沃达丰的通用客户端设备 uCPE 概念验证作为示例指出传统的客户端设备已部署为具有紧密耦合的专有硬件和软件的固定功能网络设备, uCPE 的设计用意就是要将之取代,通过将软件与硬件解耦,并在开放式商用硬件上运行现代云原生软件,以此达成目的。
Arm 与沃达丰及其他合作伙伴共同展示 uCPE 可以同时运行虚拟化和容器化的网络功能,并且与传统供应商相比可节省大量电力这能让运营商降低成本、提高能效,并加快用于软件定义广域网 SDWAN、防火墙和其他连接服务的网络设备性能。
Neoverse V1和N2平台详细揭秘
Neoverse V1的目标是带动高性能计算的变革,据介绍,与N1相比,Neoverse V1带来了 50%的性能提升、1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化,同时,Neoverse V1也是Arm强调性能优先的新型计算系列的第一个平台。Neoverse N1使芯片合作伙伴能灵活地为高度依赖CPU性能和带宽的应用构建计算能力,并为其提供 SoC 设计的灵活性。
秉持性能至上的思维,Neoverse V1 的设计理念创造了Arm迄今为止设计过的最宽微架构,以便容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。Neoverse V1宽而深的架构,加上 SVE功能将使其在单核性能和通过SVE延长代码存活期等方面占据领先优势,并为芯片设计人员提供可实现的灵活性。在法国芯片公司 SiPearl 和韩国电子通信研究所( ETRI )的高性能计算 SoC 中都能看到这些设计要件的优势。
Neoverse N2:引领从云到边缘应用的性能
Neoverse N2平台是第一个基于Armv9架构的平台,在安全性、能耗以及性能方面都有全面的提升,正在为基础设施核心铺平道路。
相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%¹。Neoverse N2 具备良好的可扩展性,可以横跨从高吞吐量计算到功率与尺寸受限的边缘和5应用场景,并在这些应用中带来优于N1的表现,例如,在云端上提升 1.3 倍的NGINX,在 5G 和边缘应用上提升 1.2 倍的DPDK 数据包处理。
Neoverse N2平台提供了优异的单线程性能和业界领先且能为用户减少TCO的每瓦性能表现。Neoverse N2是第一个具备SVE2功能的平台,该功能可为云到边缘的性能效率带来巨大的提升。在诸如机器学习、数字信号处理、多媒体和5G等广泛应用场景中,SVE2除了带来大幅性能提升外,还带来 了SVE 具备的编程简易性及可移植性等优势。
基于CMN-600的成功基础,CMN-700在每个矢量上进一步提升了性能——从内核的数量、缓存的大小,到附加内存及 IO 设备的数量和类型。
CMN-700 赋能了多芯片、内存扩展和加速器的下一代应用场景实现。通过Arm对CCIX和CXL持续不断的投入,更多的定制选项应运而生,进而使合作伙伴的解决方案具备总线和高核数的可扩展性特色。这将为突破传统的硅限制提供新的机遇,并为紧密耦合的异构计算提供更大的灵活性。Chris Bergey表示Neoverse平台可以很好地与FPGA,发挥FPGA在数据处理上的加速优势,实际上,有的客户已经把Neoverse平台和FPGA封装在一起。
Arm基础设施生态系统建设
据Chris Bergey介绍,Arm基础设施生态系统近来持续增长、势头强劲,Neoverse在Arm生态系统中受到了广泛的关注与采用,以下列举了Arm合作伙伴基于Neoverse的新功能,为基础设施市场带来了卓越的产品性能、 每瓦性能和TCO等优势:
1、Marvell发布了基于Neoverse N2 的OCTEON系列网络解决方案,并预计于2021年底前试产。相较于前一代的OCTEON解决方案,其性能提升高达3倍。
2、印度电子信息技术部(MeitY)已宣布将加入法国芯片公司 SiPearl 和韩国电子通信研究所( ETRI)的行列,采用Neoverse V1驱动国家级百万兆级高性能计算项目。
3、甲骨文计划在Oracle云基础设施上采用Ampere® Altra® CPU,为各种工作负载提供最佳的性价比。
4、由Arm技术驱动的AWS Graviton2通过稳定的增长与区域扩展,正持续快速地扩张其EC2的覆盖。
5、阿里云在即将上线的基于Arm架构ECS 实例上完成了测试,结果显示在 SPECjbb® 的测试数据中获得了惊艳的表现,且基于Arm架构运行的 DragonWell JDK 性能提高了 50%。
6、腾讯在硬件测试和软件支持方面持续投入,使其在云应用上能采用 Arm Neoverse 技术。
Chris Bergey表示:“展望下一个计算时代,我们想要改变行业对部署基础设施的思维。每一个创新者都不应该被要求在性能与能耗之间进行抉择, Neoverse 平台提供了两者兼得的最佳解决方案,促使从云到边缘的广泛应用能够实现。”(完)
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利!