英特尔重磅发布!全面升级至强6处理器家族,赋能AI与智算新时代!

作者:电子创新网张国斌

1 (1).png

今天,英特尔正式推出面向数据中心、网络及边缘计算的全新至强6处理器6700P与6500P系列,进一步完善至强6家族产品组合。此次升级聚焦性能突破、能效优化与AI加速能力,旨在为企业级用户提供更高效、更安全的算力基础设施支持。

2.png

“从去年6月我们发布第一款至强6,到去年9月所发布的6900P,即最高性能的128核至强6。再到今天推出的主流产品系列——6700P和6500P,至强6系列产品日益完善。”英特尔数据中心与AI集团副总裁兼中国区总经理陈葆立指出,“6700P和6500P相比其他产品,核数不是最多的,但它的目标更广泛,即传统数据中心企业应用,它支持的形态除了单路、双路还有4路或8路等不同的服务器设计。它针对数据中心中广泛的应用,比如说AI、科学计算、传统大数据、网络以及存储,都进行了迭代升级。”

3.png

据介绍,英特尔® 至强® 6700/6500性能核处理器,堪称是现代数据中心的理想CPU,能够提供出色的性能与能效平衡。与上一代产品相比,至强6处理器在广泛的企业工作负载中实现了平均1.4倍的性能提升3。作为AI系统的机头节点CPU,至强6可与GPU搭配,为客户提供优选组合。此外,它以更少的核心数量,提供高达1.5倍4的AI推理性能提升。至强6处理器还具备出色的每瓦性能效率,以5年使用周期计,平均可以实现以一台新的服务器替代五台旧服务器5,在某些用例中该比例可达10:1,从而节省高达68%的总体拥有成本(TCO)6。

陈葆立特别指出相比高核高密度计算的大芯片,新品的TDP(注:TDP:Thermal Design Power,热设计功耗,是指处理器在最大理论负载下产生的热量值,单位为瓦特(W)。它是硬件设计和散热系统的重要参考指标,)也比较适合传统的机架,如150W-350W的TDP,在内存通道上也有8个内存通道的配置。而在不同的配置上,所有性能核产品均支持包括AMX在内的传统特殊加速器。此外,还包括TDX安全软件、QAT等,这些英特尔特殊指令集已在前两代产品中推向市场,并获得良好反馈。在至强6中也将继续支持这些功能。

4.png

“在这一代的内存上,我们推出了新技术——MRDIMM,可以在第一时间大幅度提升内存带宽。”他强调指出,“很多年前,英特尔就和业界很多领先厂商做了MRDIMM技术的推进,通过两三年的共同开发和验证,非常高兴在至强6产品上,首次推出这款更高速的内存产品。相比内存速度在4800-5600MT/s的第五代至强,至强6的速度已经提升到了DDR5 6400MT/s。但MRDIMM可以把这个速率大幅提升到8800MT/s。相比于现已在市面上部署的数据中心服务器,提升达到50%以上。”

5.png

据介绍,英特尔® 至强® 6700/6500性能核处理器,堪称是现代数据中心的理想CPU,能够提供出色的性能与能效平衡。与上一代产品相比,至强6处理器在广泛的企业工作负载中实现了平均1.4倍的性能提升3。作为AI系统的机头节点CPU,至强6可与GPU搭配,为客户提供优选组合。此外,它以更少的核心数量,提供高达1.5倍4的AI推理性能提升。至强6处理器还具备出色的每瓦性能效率,以5年使用周期计,平均可以实现以一台新的服务器替代五台旧服务器5,在某些用例中该比例可达10:1,从而节省高达68%的总体拥有成本(TCO)6。

陈葆立表示至强6处理器家族基于英特尔最新架构设计,覆盖从16核到128核的多样化配置,满足不同场景需求。与上一代产品相比,其综合性能提升最高达50%,单核性能与内存带宽显著优化,它有如下特点:

AI加速:内置AMX(高级矩阵扩展)指令集,支持传统AI推理及中小型生成式模型。配备86核的至强6处理器在图像分类等任务中,性能较竞品高出50%以上。

内存升级:至强6是首款支持MRDIMM的平台,能够为带宽敏感的中小模型推理任务提供更好的性价比。搭载MRDIMM技术内存速率提升至8800MT/s,带宽较第五代至强提升超50%,为AI训练、大模型推理等高吞吐场景提供关键支持。

能效优化:通过动态功耗管理技术,在40%负载下实现60%的能效提升,并新增“延迟优化模式”,兼顾响应速度与能耗控制。

6.png

此外,它的安全与扩展性全面升级,至强6系列强化了数据中心与边缘场景的安全性,搭载了英特尔独有的TDX Connect技术,据英特尔技术专家解释,在第四代、第五代至强处理器中,就已经有了TDX技术,它通过硬件保护的方式,使得系统中间任何软件和固件,例如host主机操作系统的内核,甚至是操作系统的底层固件,都无法获得跑在这个系统上的上层业务数据。

进入到AI时代以后,异构系统越来越普及,业界希望英特尔可以和其他加速卡生产商一起联合构建一个不仅包含CPU,同时也包含GPU的硬件防护的体系。这就是在至强6推出的TDX Connect技术。它通过在系统中至强处理器和GPU的联合协作,构建了一个整体的防护网。无论是放在CPU上的数据亦或是业务入口,又或者运行在GPU上的模型参数或是模型数据,都能得到硬件防护。“所谓硬件防护是指,就算这个机器是一台云主机,提供云服务的云提供商也无法获取用户的任何数据。这就是TDX以及TDX Connect带来的一个显著变化。这对于AI时代的数据保护来说,是非常有用的。”专家解释说,“这种联合GPU构建硬件级防护体系,确保了CPU与GPU间的数据全链路加密,可以抵御量子计算威胁。”

7.png

该技术专家表示在新的至强6产品上可以完整地支持了业界标准CXL 2.0,一个突出的应用场景就是如何通过CXL2.0扩展内存,来以更高的性价比去拓展服务器的内存空间。

但他指出这还不足以让最终用户方便地调用CXL内存,因为拓展出来的内存是一种新的设备,需要软件适配。以至于客户要为了这样一种新拓展出来的内存层来做一些调度算法,这对于客户而言,其实增加了潜在的TCO。针对这一问题,英特尔在硬件支持标准的基础上,额外加入了新的硬件和固件功能,称为“Flat Memory Mode”,它可以通过软件不感知的方式,自动切换热数据和存储在CXL内存上的温数据,达到真正的性能和容量之间的平衡。

以业界知名的大内存数据库SAP的HANA来说,这类产品解决方案对CXL的需求非常高,同时也需要降低自身研发成本。因此,结合英特尔的CXL拓展内存和Flat Memory Mode就可以同时满足两个目标。

此外,新的至强6单插槽平台支持136条PCIe 5.0通道,满足AI服务器、存储密集型任务对高连接性的需求。

陈葆立强调至强6成为GPU服务器的“机头节点”首选,凭借高I/O带宽与稳定性,加速大模型推理与数据处理。英特尔技术专家表示:“MRDIMM与至强6的组合,可在128核平台上实现超越竞品50%核心数的性能表现。”

他表示除此之外,专为运营商设计的至强6系统级芯片(SoC)整合vRAN Boost、媒体转码加速器等模块,性能功耗比提升达70%。在5G基站中,结合AI能耗控制技术,可降低30%网络功耗。

针对AI应用的优势

8.png

英特尔技术专家指出:实际上,AI是一个跨度很长的领域(Spectrum),如上图所示,最左边是常见的媒体处理、推广搜索、矢量数据库等,这些通常被称之为经典的机器学习。中间是数据量比较小的生成式AI模型,比如说小于20B的模型,在过去的实践中,英特尔发现,在小于20B的模型规模下,用至强做生成式AI的推理是很有优势的。、

右边是更大参数的生成式AI模型,至强在其中会扮演重要的机头节点CPU的角色。PCIe的通道数,IO稳定性以及内存带宽,对于整体的端到端的大模型的推理也非常重要。

9.png

他指出由于至强有内置的AI加速器AMX,即英特尔高级矩阵扩展,在AMX的加持下,可以看到,在配备86核的至强6 SP处理器上,在这类工作负载的性能可以超过友商配备更多核心数的CPU。在图片分类这样的传统AI领域最高可达50%以上的性能提升。

10.png

他表示对于小规模的大语言模型而言,其推理过程不仅在生成首个Token时需要进行密集的计算,更重要的是,在后续的大多数token推理中,对内存带宽的需求非常高。因此,至强6处理器与MRDIMM技术的结合可以带来更佳表现。得益于MRDIMM技术的加持,在进行大模型推理时,一个配备128核的至强AP平台,其性能甚至可以超越竞品配备更多(例如50%)核心的平台。这当中主要的原因是目前只有至强平台支持的MRDIMM可以达到8800MT/s的带宽性能。对于追求性价比的中小模型推理而言是非常重要的。

11.png

而在端到端的业务流程中,不管是传统的AI,还是现在的生成式AI,都有矢量数据库搜索的需求。这些需求在实际的行业部署中非常广泛。同样地,得益于至强内置的AMX加速引擎,在同等核心数下,至强在矢量数据库离线构建索引表的过程中,性能甚至可以高过友商30%。在线上搜索过程中,英特尔也有软件技术的加持,即Scalable Vector Search (SVS)这样一个专门针对大规模矢量数据库的索引创新,充分利用了英特尔CPU的硬件特性,所以相比友商,性能提升可以达到2.6倍。

陈葆立指出从英特尔的角度来看,AI在数据中心中有多种应用场景。早在大模型兴起之前,AI就已经广泛应用于数据中心,包括推荐引擎和搜索等领域。许多国内的大型互联网企业一直使用大量的至强处理器来支持这些业务。多年来,英特尔推出了多种AI加速技术,例如AMX加速器,帮助客户提升AI计算性能。相比友商,英特尔在支持AI场景方面充满信心,技术上也具有明显优势。

在GPU服务器中,机头位置的CPU选择至关重要。在处理大模型计算时,我们通常关注两个性能指标:一是提问后第一个回答的延迟时间。如果使用CPU处理,这一指标与内存带宽密切相关,因为CPU需要快速调取数据进行分析并给出响应。

随着更多新模型的出现,客户对推理算力的需求增加,但并非所有场景都需要超大规模模型。客户开始关注至强6处理器与MRDIMM的组合是否能在不同场景下有效支持大模型运算。英特尔已经证明,这种组合是可行的。尽管国内有许多不同类型的加速卡,现阶段最新一代至强6处理器系列依然是客户和合作伙伴的首选平台,并且能够进行更好的适配和验证。

英特尔中国网络与边缘事业部总经理阮伯阮伯超指出在网络及网络边缘领域,AI有着广泛应用。例如,将AI应用于网络节能控管。在 5G 网络中,很多网络单元存在功耗较高的问题,通过运用AI技术控制CPU能耗,可实现30%的节能效果。同时,很多人也将AI与vRAN进行融合。在5G基站中,很多要素需要进行调配与优化。

“我们与国外厂商合作,将 AI 技术与软基站能力整合于一个系统级芯片中,实现了极为快速的调配与性能提升。反观其他架构,如果将AI和软件能力分置于两个独立单元,比如一个放在CPU,一个放在GPU,由于网络运行对实时性要求极高,这种分离方式很难满足实时性需求。而我们采用的架构,将相关能力全部集成于CPU,并借助AMX进行加速,这对网络AI的发展具有推动作用,能够产生良好的效益。”他指出,“在当下对AI应用场景需求更高且更为多元的背景下,特别是在5G到5G-A以及AI原生的环境下,从我们的角度来说,这款面向网络与边缘的系统级芯片,不仅具备了此前提到的AVX、AMX、AI加速的功能,也是着重于将连接、算力、AI等特性进行融合,进而实现一个高性能、低时延的处理,且可在单一设备或是单一处理器中完成。我们相信各种各样的工作负载,例如从接入到媒体流的转码,乃至AI的预处理、后处理及输出等环节,都可以尽可能在单一设备当中完成,进而提升效率,且契合多元化的应用场景需求。”

全新以太网解决方案同时发布

为满足企业、电信、云、科学计算、边缘和AI应用日益增长的需求,英特尔今天还推出了两条全新的以太网控制器和网络适配器产品线--英特尔以太网控制器E830和网络适配器,以及英特尔以太网控制器E610和网络适配器。这些新一代解决方案可以提供强劲的高性能连接,同时提升能效与安全性,并降低总体拥有成本(TCO)。

12.png

据英特尔中国网络与边缘事业部总经理阮伯超介绍,英特尔以太网E830系列为虚拟化企业、云、电信及边缘环境中严苛的工作负载提供高性能、安全且高能效的解决方案。首批产品包括双端口25GbE PCIe和符合OCP 3.0标准的适配器,更多配置版本将于年内陆续推出。英特尔以太网E830系列的关键特性包括:

高速的性能表现:英特尔以太网E830产品支持在PCIe 5.0总线上实现高达200GbE的速率,其提供的带宽是上一代产品的两倍,可实现更快数据传输与更优应用响应。

灵活的端口选择:英特尔以太网E830产品提供1x200GbE、2x100/50/25/10GbE和8x25/10GbE等端口配置,让企业能够定制网络基础设施,满足特定的性能与成本需求。

出色的时间同步能力:具备精确时间测量(PTM)、支持1588精确时间协议(PTP)、同步以太网(SyncE)及支持全球导航卫星系统(GNSS)等特性,对电信、金融服务及AI训练与推理等领域的关键时间同步应用至关重要。

增强的安全性:英特尔以太网E830系列搭载英特尔安全技术,如安全启动(Secure Boot)、安全固件升级(Secure Firmware Upgrade)及双硬件信任根,并通过符合CNSA 1.0和FIPS 140-3 Level 1标准的后量子加密(PQC)解决方案,抵御未来风险。

13.png

英特尔以太网E610系列面向控制平面网络将可管理性、能效与安全性集于一身。英特尔以太网E610产品提供多种速率和外形规格,具备以下特性:

现代连接:支持10GBASE-T、5G、2.5G及1000BASE-T技术,英特尔以太网E610产品为数据中心控制平面、工作站及边缘应用提供高效、高性能的连接。

全面的可管理性:英特尔以太网E610系列具备安全协议与数据模型(SPDM)、平台级数据模型(PLDM)、基板管理控制器(BMC)直通及支持网络控制器边带接口(NC-SI)等特性,能简化网络运维并降低管理开销。

出色的能效表现:与上一代产品相比,英特尔以太网E610产品功耗降低达50%,在助力降低运营成本的同时最大限度减少对环境的影响¹。

强大的安全性:英特尔以太网E610系列包含了用于安全固件更新的硬件信任根,和符合CNSA 1.0标准的现代加密安全功能,为网络完整性提供重要保障,有效抵御网络威胁。

无缝升级能力:全面兼容前代10GBASE-T适配器,简化升级方式,确保客户充分释放既有基础设施潜力。

在媒体问答环节,陈葆立在回答至强6处理器与arm架构处理器对比时指出,“在国内,通用的商用服务器方面,很少听过arm架构处理器,X86目前占据主导地位。基于我们十多年来的软件生态发展,以及对各种软件的支持,大部分的云客户和一些传统企业用户都非常希望能够部署一个x86的生态架构,基于来更好的支持他们的业务。”

“在X86的大生态下,这几年,以英特尔为主导的厂商都推出了非常多新品,大家可以看到至强6相比前一代有大幅度的性能提升。相比来讲,至强6的优势主要体现在如下几个方面:首先,对于AI特性来说,包括AMX在内的加速器都是英特尔特有的。其次,至强作为AI服务器的CPU机头节点首选、更快的内存支持、更好的单核性能等,这些都是我们的客户和用户持续选择至强产品线的原因。而且,从至强多年的表现来看,其具备较强的可靠性和稳定性,这也是客户持续选择至强作为云计算和AI计算的最主要的原因。”他补充说。

针对目前热门的DeepSeek一体机,陈葆立表示英特尔始终持续与生态伙伴合作,在支持开源大模型方面投入巨大。无论是国际上常用的开源模型(如Llama)还是国内的模型(如通义千问)等,英特尔都在模型发布当天宣布了对其的支持,这得益于英特尔在模型发布前一周或两周与模型发布商(如阿里、Meta)进行的早期验证工作。DeepSeek可以说是过去一个月内全球最热门的大模型之一,相信大家也在一些媒体平台上,也看到了不同英特尔平台上针对它的一些性能优化。

目前,许多客户在采购新的GPU服务器或AI服务器时,仍选择搭载英特尔CPU,这表明市场对英特尔产品的需求依然强劲。此外,英特尔也看到,大模型在汽车、手机、PC和云端等领域的广泛应用,也为生态创新带来了更多可能性。特别地,英特尔客户对至强处理器与MRDIMM的组合表现出浓厚兴趣,英特尔也在进行相关验证。

“创新永无止境,未来可能还会出现新的大模型版本,需要我们不断重新优化。因此,英特尔将始终保持准备状态,凭借我们在CPU和加速器领域的优秀产品,支持客户的各种工作负载,无论是推理、大模型、中模型,还是满血或蒸馏版,我们都能提供强大的支持。”他强调。

据悉,英特尔至强6系列处理器已经在数据中心生态系统中得到广泛采用,截至目前,超过500款产品设计已经推出或正在开发中。这些服务器系统、软件解决方案和服务将通过全球卓越的合作伙伴提供给客户。

陈葆立透露2026年,英特尔将推出基于18A制程的下一代至强Clearwater Forest处理器,进一步夯实其在企业级计算市场的领导地位。

最新文章