超大规模分布式资源池 浪潮云海助力中国铁塔斩获IDC未来企业大奖

近日,IDC公布了2024年度"IDC中国未来企业大奖"优秀奖名单,由浪潮云海协助中国铁塔打造的"分布式资源池项目",凭借在大规模分布式资源池建设上的先进架构与卓越性能,以及所呈现的技术探索价值,一举斩获"未来数字基础架构领军者"奖项

IDC未来企业大奖由全球权威IT市场研究和咨询公司IDC(国际数据公司)设立,旨在表彰在使用数字基础设施改造业务、吸引客户和员工并加速业务创新方面处于领先地位的组织,具有前瞻性、中立性和国际性特点。

一体两翼战略:中国铁塔重构未来业务版图

作为目前全球最大的通信基础设施服务商,中国铁塔正在通过"一体两翼"战略重构公司的未来业务版图,即以面向通信行业的运营商业务为"一体",以依托独特资源优势面向社会的智联业务和能源业务为"两翼",持续强化资源统筹共享能力,成为数字经济的牢固基石、信息高速公路的坚实底座。

随着"一体两翼"战略的深入,中国铁塔在国内已建造了海量的数字基础设施,累计完成基站建设项目超410余万,拥有210万站址资源、能源设施和近百万处机房,升级22万现有"通信塔"为"数字塔"。中国铁塔的业务具备鲜明特点,一是地域跨度极大,二是设备数量极多,三是数据类型复杂且海量。以数字塔为例,塔身上挂载环境监测仪、气象监测仪、基站CDN、卫星地面增强、传感器等诸多信息化设备,可采集声热光电磁等各类传感器数据,以及视频、图像等非结构化数据,提供视觉感知、数据采集、图像分析、信息处理等多种数字化服务。据中国铁塔估算,每数据中心每日新增数据量数十T,预计2025年每数据中心接入约二十万站,未来数据规模将达数十PB级别。

如何管理利用好铁塔分布在数百万平方公里的海量数字基础设施,通过新一代信息通信技术赋能千行百业实现数字化转型,服务"数字中国"战略蓝图,已成为关乎中国铁塔未来企业发展的核心命题。

分布式资源池建设:源自中国铁塔业务的最优选择

中国铁塔集团信息技术研究院院长叶臻认为,无论是从基础设施的广域分布,还是从数据采集的压力来看,中国铁塔现在已经形成点多面广的实际形态,并且在未来仍有巨大的扩展空间,采用集中资源池的传统模式会面临很大挑战。目前,整个行业都在探索从集中大型云到边端小型云建设经验,包括边端侧应用的轻量化设计、最优算力的配置、分布式资源的有效调度等等,这已然成为未来数字经济发展中非常关注的技术。中国铁塔在这个领域所做出的积极探索,是赢得IDC"未来数字基础架构领军者"奖的重要原因。

为此,中国铁塔启动了分布式资源池项目,在接入并纳管海量数字基础设施的同时,进一步融合人工智能、大数据、物联网等多样化的数字技术,实现从独立系统到融合系统的转变、从被动记录型系统到主动决策型系统的转变、从业务管控到场景赋能的转变,支撑企业全面的数字化、智能化转型,并更好的赋能千行百业的智能化变革。

而在中国铁塔分布式资源池建设过程中,如何管好、用好"点多面广"的异构资源无疑是最大的挑战。铁塔的业务场景丰富,整个项目覆盖多个省份节点,设备类型多样,使用大量不同厂商、不同型号的设备,涉及到不同架构的 CPU、GPU、FPGA 等多元异构算力资源,资源统一调度管理需要解决兼容性问题;第二是性能和可靠性挑战,分布式资源池环境下,数据需要在不同站点之间进行传输和同步,尤其是视频采集等对实时性要求高的业务,需要极高的I/O性能和稳定性,解决数据大规模并发问题;最后是统一运维管理难题,如何实现铁塔多各数据中心的统一监控、故障预警、快速响应和协同工作,保证业务的连续性,是运维管理的难点。

中国铁塔+浪潮云海:领军未来数字基础架构,打造未来通信数字基础设施新样板

为解决上述中国铁塔业务发展面临的挑战,浪潮云海基于"开放兼容、分层解耦"技术路线设计,为中国铁塔多个省级分公司构建了一云多芯、存算解耦、统一运维的分布式资源池,实现资源灵活调度,业务统一运营,支撑中国铁塔数十个业务系统上云,实现分钟级响应,确保其全国各级数据中心的持续建设和面向未来的数字化转型发展:

■ 一云多芯,实现铁塔异构资源的高效利用:云海OS以强大的一云多芯能力,为铁塔各省级节点提供同资源池异构管理、同源异构代码持续集成的能力,将省级节点内分布的多资源池进行整合,根据业务需求动态分配资源,例如视频采集业务量突增时,调度系统会自动识别并分配更多的 CPU 和 GPU 资源来处理数据,实现高效的资源利用。同时,针对异构应用提供微服务治理服务,实现多架构应用全生命周期管理;

■ 存算解耦,满足铁塔两翼业务海量存储、超高并发需求:以存算解耦架构设计,真正意义上实现铁塔全国各省级节点间的独立扩展及灵活共享,支撑了覆盖环境监测、风险预警以及新能源等应用场景的智能视联业务,确保实时性要求高的业务数据可以快速传输,满足中国铁塔及各类行业用户对多样化地形、不同应用场景的海量数据存储与处理需求;

■统一运维,24H全天候保障铁塔业务:面向覆盖全国6个省份的铁塔基站监控系统等设备,通过统一运维管理平台将业务监控信息统一推送至告警平台,实现7*24全天候运维响应;同时基于AI服务,为铁塔业务管理者提供了简单统一的管理体验,并实现极致的资源利用。

分布式资源池项目极大提升了中国铁塔的业务效率和数字化赋能水平,业务平均上线时间由原来的数天缩短至2小时,资源管理效率大幅提升,支撑全国数十个办公业务上云,超40000用户同时在线办公,让高效协同的业务管理平台从管理中心延伸到业务的细枝末节。同时强大的分布式资源调度能力可支撑200余万站视频数据实时处理,为大生态、大安全、大民生等重点行业提供空间数智化治理服务。

当前算力已经成为数字经济时代的新型生产力,正呈现多元泛在化发展趋势,由集中式向"云边端"分布式范式转变。浪潮云海实施的中国铁塔分布式资源池项目,在为中国铁塔拓展新赛道、发展新业态提供有力支撑的同时,也为通信行业建设高速泛在、集成互联、智能绿色、安全可靠的新型数字基础设施树立新的标杆,推动通信行业在数字经济中更好的发挥基础性、先导性作用。

稿源:美通社

最新文章