昨天,Arm公布了其Neoverse系列数据中心芯片技术的路线图更新。
Arm在整个基础设施市场快速迭代创新,其路线图包括在云,高性能计算和人工智能领域应用的V系列,应用于云,5G,网络,边缘领域的n系列,以及应用于5G,网络,基础设施等边缘领域的E系列。
具体来看,Arm宣布推出代号为Demeter的Neoverse V2平台,该平台已打造数年,其N系列产品线将于明年更新目前,近20个合作伙伴正在基于N2平台进行设计,新的N系列已经在开发中Arm也启用了E2平台,并计划更新E系列
一,Neoverse V2平台发布,性能,能效,扩展性升级。
Arm基础设施部门产品解决方案副总裁Dermot O'Driscoll表示,Neoverse V2在为云工作负载提供卓越的性能,可扩展性和效率方面具有领先优势。
单芯片性能和单线程性能是云决策者的两个关键指标单线程性能明确了扩展需求最高,性能要求高的工作负载是否可以迁移到Arm单个芯片的高性能使得通过平台上运行的大量横向扩展工作负载来最大化投资价值成为可能
非常大的互联网公司非常关注TCO或者TCO支出,更关注这部分TCO支出能带来的业绩,这是他们盈利的关键而Neoverse V系列就擅长这个
Arm此次推出的Neoverse V2平台,得益于其与客户在未来设计需求上的紧密合作,收到了Arm的V2相关反馈,包括我希望提高云工作负载的性能,在平衡功耗和面积的同时,我将继续推广单线程性能,尽快交付,帮助我们快速打开市场!这三件事Arm都做了。
对于云工作负载,最基本的要求是强大的整数性能,良好的可扩展性,以及云运营商的高效率,因为高能效使云提供商能够在每台服务器上提供更多的核心和托管更多的客户,从而有助于降低成本。
Neoverse V2将提供市场领先的整数性能目前,SPEC Integer Rate用于衡量估计值,模型中的各种云基础架构工作负载已用于调整微架构德莫特·奥德里斯科尔表示,整个系列赛的结果让他们非常兴奋
除了整数可伸缩性之外,现代云应用还拥有大型工作数据集如果你能把尽可能多的数据保存在CPU附近,那将是一个巨大的优势因此,Arm在V2 neo verse增加了2MB专用L2缓存这是V1上L2的两倍,使用延迟的负载不变,可以显著提升MySQL,Memcached等云应用的性能
同时,矢量性能对于HPC等快速向云迁移的工作负载也很重要从SVE到SVE2的过渡已经在Arm Neoverse V2上完成,SVE2可以帮助满足更多的非HPC ML工作负载,同时增加更多的加密指令Arm还将矢量引擎重构为4通道128位,并对微架构进行了调整,以提高其有效吞吐量
在系统层面,能够支持大量DRAM是非常重要的在IO方面,他们希望能够通过IO总线连接GPU,TPU和基于NVMe的SSD,因此总线应该很快,并支持高带宽
借助V2平台,合作伙伴能够利用支持Neoverse N2的系统IP背板,包括CMN网格,MMU,GIC和NI非统一互连CMN—700网状互连支持每个芯片高达512 MB的系统级缓存,当前基于CMN—700的设计为每个内核增加了一个系统级缓存,从而提高了云原生工作负载的性能
CMN—700支持2.5D设计,其平台可以随时过渡到3D,可以将每个内核的缓存级别推向新高CMN—700还支持高达每秒4TB的网格带宽HBM2e内存堆栈需要每秒0.5TB的带宽
客户还需要Armv9特有的安全特性和极具竞争力的系统平台在这方面,一些关键的Armv9安全增强功能已被引入Neoverse V2,其主要目的是防范内存攻击,这也是最常见的攻击类型
二,Arm Neoverse新产品的四大关键原则
Newverse的新产品基于几个关键原则,将继续提供基础设施市场所需的性能,效率和专用处理能力。
首先是可扩展的效率两年前,Arm推出了V,N,E系列的核心设计原则此后,基于这种计算基础的解决方案大量上市
另一个关键原则是技术领先。Arm实现了多个行业第一:第一个CPU其总内存带宽超过每秒1TBffg 'gv 'b第一个单管芯上可以配置100个以上的CPU,核数达到128个,第一CPU将DDR5和PCIe Gen5.0推向市场,SPEC CPU 2017基准测试首款突破500整数跑分的CPU...
第三是快速创新的步伐今天,这些CPU中的大多数仍然以单个芯片的形式交付,但这种情况正在迅速改变采用Graviton3的云gg服务今年发布了GA版本,其中Graviton3使用了7个小芯片加速计算将计算小芯片与加速器小芯片结合在一起,如英伟达的格蕾丝·赫柏超级芯片正因为如此,Arm才会成为UCIe的创始成员
在推动各种重要互联技术的过程中,Arm及其合作伙伴都参与其中多年来,Arm一直致力于开发和增强AMBA CHI,这是实现高速低延迟芯片间通信的重要协议今天,Arm的合作伙伴在CMN系列中使用AMBA智,Arm正在与UCIe社区合作
Arm也是CXL的成员之一,并将其视为桥接芯片到芯片解决方案的关键互连技术,例如将扩展内存,多个GPU或TPU连接到一个计算节点。
Arm基础架构事业部产品管理高级总监Brian Jeff透露,目前这一代Neoverse系统总线支持CXL 2.0,希望在新一代系统总线中支持CXL 3.0届时,预计它将通过Neoverse V2公司使用其新一代总线技术根据他的观察,目前内存扩展用例对CXL 2.0的需求还是很大的,预计在非常大规模的市场中,会有一些设计将CXL用于这些用途
根据介绍,这一成就是在Arm合作伙伴选择可扩展效率计算基础,并使用CMN等互联技术增加其专用处理能力的情况下才能实现的这体现了解决方案的多样性,只能在Arm架构上实现
Armverse平台的第四个也是最后一个原则是构建独特的开发者生态系统Arm Ready旨在打造一个软件可以开机使用的世界,Arm将借助生态系统和开源社区的展示,继续优化
三Arm Neoverse今年取得了许多里程碑式的成就
Arm高级副总裁兼基础设施事业部总经理Chris Bergey也回顾了Arm Neoverse今年的几项标志性成果,包括:
1.在全球范围内,Arm已经应用于各大公有云,包括AWS,微软,谷歌,阿里巴巴,甲骨文等科技巨头这意味着现在全球每个开发者都可以获得Arm Neoverse
2.在5G RAN领域,Arm无处不在在世界移动通信大会上,戴尔和Marvell宣布合作,高通也与乐天和HPE达成合作他们正与诺基亚,联想,三星和其他公司合作,酝酿更多令人兴奋的项目
3.英伟达发布人工智能和高性能计算Grace。
4.步入更传统的企业领域利用VMware DPU公司实施蒙特里项目RedHat的OpenShift支持Arm架构SAP HANA正在将其云基础设施迁移到AWS Graviton6月,HPE推出ProLiant第11代平台,搭载基于Arm Neoverse的Ampere Altra处理器
我们已经到达了一个转折点,有了一个新的开始Arm架构是全球计算未来的基石!克里斯·伯杰说
在中国市场,Arm Neoverse也势头强劲除了大型企业,一些初创企业也开始设计基于Arm Neoverse的芯片Arm基础架构事业部全球副总裁邹婷在接受采访时表示,比如宇先微电子和洪钧微电子致力于云原生服务器CPU的研发,云豹智能主要针对DPU领域他们正在开发基于N2新宇宙的产品
Arm的v系列内核,AWS gravity on 3的Neoverse V1和NVIDIA Grace的Neoverse V2将提供目前市面上最好的单线程性能安培Altra Max和阿里的永恒710将继续提供最佳的单芯片吞吐量
Dermot O'Driscoll还谈到了Arm如何建立软件生态优势Arm多年来一直在尝试实现和优化运行在Arm架构上的全栈解决方案从架构和IP到技术库,运行环境和编译器,各种基础设施软件都能够发挥最大性能
下一个发展趋势是机器学习就像Java在今天的云工作负载中占有很大的比重一样,ML正逐渐成为未来的首选工作负载在ML中,Arm可以用同样的方式启用BERTV1的核心有一组致力于增强ML应用程序性能的函数
Neoverse在架构上增加了Bfloat16:调整了V1,N2以及后续的微架构,旨在通过BERT改进BF16的实现,增加BF16对Arm计算库的支持,并将ACL集成到oneDNN ML框架中,配合Tensorflow运行BERT。
BERT运行在基于V1核心的AWS EC2 C7g上,与使用最新至强核心的C6i相比,Arm架构上BF16优化的堆栈性能比Intel高80%V1 BF16和Int8 MatMul的加入,意味着ML模型可以更紧凑地嵌入到内存中,只需要更少的内存带宽,使得Graviton3的ML性能是Graviton2的3倍
当被问及如何看待RISC—V指令集架构的竞争时,Dermot O'Driscoll认为,如果RISC—V想要在终端或云应用中更具竞争力,就需要他们在架构,软件和标准上进行多年的投资,很可能还需要有类似Arm的治理模式。
结论:Arm为云平台的可持续发展提供了另一条道路。
正如你所看到的,Arm并不为传统市场构建标准产品,而是与云,HPC和无线基础设施领域的主要市场参与者密切合作,因此它可以真正了解他们的工作负载和挑战,并针对特定的市场需求进行定制。
从手机,电脑,AR/VR耳机,物联网设备,汽车到云计算,Arm随处可见,全世界的开发者都可以获得如今Arm不仅支持云平台和企业都想要的负载均衡和冗余,也为开发者提供了另一条可持续发展的道路