
作者:电子创新网张国斌
2月28日,由达摩院举办的2025玄铁RISC-V生态大会在北京举行,中国科学院软件研究所、国网南瑞、普华基础软件、经纬恒润、新思科技(Synopsys)、Cadence、西门子EDA等全球数百家企业及机构齐聚一堂。
在下午的演讲中,阿里达摩院首席科学家、知合计算CEO孟建熠发表了《从Deepseek 创新看 RISC-V的机遇》的主题演讲,分享了DeepSeek创新给RISC-V发展带来的启发和机遇,他特别指出,RISC-V发展的关键一步就是要打造标杆产品。
孟建熠认为,DeepSeek的出现,为整个市场带来了更多的可能性,使得算力、内存、互联原有平衡发生剧变,新算力架构机会再次进入同一起跑线,同时开源大模型单机部署成为可能,进一步推动实际应用落地。具体的创新包括:
MOE实现更低的激活比:以更低的激活比达成更低的计算成本,并使模型的单机部署成为可能;
稀疏计算与模型压缩技术:识别并跳过模型中不重要的计算节点(如权重接近零的部分节点),同时结合模型压缩技术减少参数量;
混合精度计算与量化技术:浮点计算转化为低精度计算(如INT8、FP8、FP16)同时保持模型精度;
动态计算图优代技术:实时调整计算结构减少冗余计算;
内存优化与数据流重构技术:通过内存优化技术(包括内存池、数据预取等)和数据流重构技术,减少内存访问延迟以及數掘传输开销;分布式计算与负载均衡技术:将大规模模型推理任务拆分到多个计算节点,并通过负载均衡技术优化任务分配。
他指出DeepSeek的出现,也让业界产生了三个不同观点的争论:第一,开源还是闭源架构。DeepSeek证明了开源也是很好的一个模式;第二,用DENSE模型还是用MOE模型。一个是更好的全能模型,一个是更好的专属模型,两种模型都拥有不错的未来;第三,内存容量成为AI大模型在算力以外的另一个指标。
他表示DeepSeek的出现,也推动行业更关注底层硬件能力的适配,强调算力资源的精细化匹配,改变了过去'大炮打蚊子'式的资源浪费现象(即过度依赖高精度计算资源处理简单任务),采用软硬件深度融合的视角重构系统设计,通过算法与硬件的联合优化提升整体效率,形成更高效的AI计算范式。
另外他指出尽管目前模型的参数量和计算量持续增长,但核心算子类型呈现出显著收敛态势,主流架构(如Transformer)的核心算子已趋于标准化。通过开源社区的开放协作,各类大模型在基础架构设计上相互借鉴,形成技术方案趋同的行业现象。开放生态加速了技术方案的迭代优化,促使行业在统一的技术路径上持续精进,既降低重复研发成本,又推动硬件针对性优化。
云端协同是最近一段时间高频出现的词语,DeepSeek将大模型蒸馏,无疑让更多的模型能够走向端侧。孟建熠强调,端侧包括大量的应用,这无疑是一个正向促进,使得高性能AI应用能够在边缘设备上顺利运行。
架构创新的最终答案:用RISC-V实现AI原生
他指出DeepSeek、Llama、Grok等开源大模型不断出现对行业带来的改变,并非只会是RISC-V机会,而是所有架构的机会,包括GPGPU、x86、DSA、ASIC等。但RISC-V架构能够以包容性实现AI原生,“RISC-V+AI”无疑会是现阶段架构创新的最终答案。
他表示RISC-V在AI领域,无疑具备很高的适应性,这些都源于其开放性和可扩展性。与x86和Arm等架构相比,RISC-V的ISA(指令集架构)完全开放,无需任何授权费用,允许任何参与者自由使用。同时,RISC-V的国际合作开发模式确保了其在全球范围内的兼容性,无论是欧洲、中国还是美国,基于RISC-V的芯片设计均可实现无缝对接。此外,RISC-V允许在芯片设计过程中添加定制指令,以满足特定需求。这一特性使得RISC-V芯片在保持与旧有软件兼容的同时,能够支持新的功能。
另外,他表示RISC-V在AI领域,还具备很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核产品或者近内存计算。随着开源RISG-V架构的快速发展,重新自研架构已意义不大以RISC-V为基础构建处理芯片是未来的主流。“今天就是做RISC-V具有非常重要的意义,最终行业一定走向生态统一的位置。”孟建熠强调。
RISC-V发展的关键一步就是要打造标杆产品
孟建熠表示现在RISC-V在一些领域的生态已经做得很好了,比如从低功耗IoT场景到服务器场景都有相关产品和生态,同时也产生一些标杆产品。但这仅仅是RISC-V的第一步,未来RISC-V一定要从小的标杆产品,走向更大的标杆产品。大的标杆产品是奠定RISC-V未来生态发展的重要一步。
他表示目前,国内企业正在尝试打造RISC-V的标杆产品。比如说,2019年7月,玄铁发布业界最高性能RISC-V处理器C910发布,为全球首个运行频率超过2GHz、SPECINT2K6达到7分/GHz的RISC-V处理器;随后在2021年10月,玄铁C910成功兼容安卓系统,可运行Chrome浏览器等应用,这是芯片行业首次实现RISC-V架构对安卓的支持,意味着RISC-V架构有望打破场景壁垒,成为高性能芯片设计的新选择。
国际上的RISC-V企业也在做标杆产品,比如Tenstorrent、Vantana和SiFive。比如说,Tenstorrent采用独特的硬件和软件紧密结合的方法,硬件专门用于AI任务,但软件并不复杂,整个软件堆栈只有大约50000行代码。
孟建熠认为,下一代RISC-V标杆产品有着一些关键指标:
如服务器场景:x86架构的Intel EMR(Xeon 5)在SPEC CPU 2006达到了SPECint 54.46/SPECfp 62.69,在SPEC CPU 2017达到了SPECint 6.98/SPECfp 9.06,同时Intel Xeon 6相比上一代产品单核性能提升1.2倍;Arm的架构的AWS Graviton4在SPEC CPU 2006达到了SPECint 66.26/ SPECfp 77.84,在SPEC CPU 2017中达到了SPECint 8.26/SPECfp 9.19;
AI PC场景:x86架构的Intel Lunar Lake NPU性能达到了48TOPS;Arm架构的Qoualcomm Snapdragon X Elite NPU性能达到了45TOPS;
AI场景:Xeon Platinum 8490H性能达到了430TOPS;Google TPU v5p性能达到了918TOPS;NVIDIA H100性能达到了3985TOPS。
“要真正从产业中走出来,还是要做更好的性价比。RISC-V如何用二十分之一做到这个主流AI芯片的效果,是需要RISC-V厂商要考虑的问题。”孟建熠如指出。“碎片化是现在RISC-V目前生态的现状,因此标准化建设也是RISV-C在下个阶段发展非常重要的工作之一。”
他指出目前国际上在指令架构上的贡献明显高于国内,国内力量的参与度不够。因此,国内产业需要在标准建设中尽快形成合力。国内已经建立多个组织,都在进行相关的指令集的制定工作,需要联合起来统一到一个平台工作。他建议,技术路线上要考虑相对集中,以AI为目标先做一轮国内制定标准的尝试,同时CPU、GPGPU、TPU在扩展上要形成一定的梯度,不能让指令集做成很多套并行大而全的扩展,这样生态无法形成。
目前国际上AI标准建设包括两条技术路线——IME和AME,达摩院两个标准都在参与建设,并且一直主导AME向前推,一起制定这个标准。此外,RISC-V工委会“并行计算SIG组”在今年1月正式成立,阿里巴巴达摩院作为工委会的轮值会长单位,不断推动标准的推进。
孟建熠指出RISC-V是一个技术创新,在技术创新一定要有很好的标杆产品去发布。如即将交付的玄铁C930就是一个很好的标杆产品,通过这一产品不断推动生态发展,形成“技术创新-产品研发”与“产品研发-生态建设”的正面双循环。“这样,上下游一定可以在广袤的领域在RISC-V+AI的领域中真正地突破,真正赚到钱,做出心仪的产品。”