论坛以中心企业算力网络创新联合体、CNCOS、异构打算架构开源项目为载体,以中国移动牵头发起的芯片间互联X-Link开放式架构为互换重点,各科研单位与企业共话芯片互联技能及超节点家当生态面临的寻衅和机遇。
中国信息通信研究院云大所副所长栗蔚表示,2024年政府事情报告强调了“适度超前培植数字根本举动步伐,加快形玉成国一体化算力体系”的主要性,显示了国家对算力的高度重视。随着国家算力一体化体系的构建,智算互联作为其核心部分,已受到广泛关注。对此,栗所提出三点建议,一是开源技能开拓,鉴于我国算力资源的多样性和分散性,建议通过开源办法联合海内力量,共同开拓智算互联的各层级技能。二是技能推进,推动统一框架技能、互联技能和云化技能的发展,形成统一的开源生态系统,达成智算网络技能共识以及和云操作系统的领悟利用。三是开源社区生态培植,依托CNCOS和异构打算架构等开源项目,设立X-Link和AICOS等子项目,以补强互联技能和云操作系统的关键环节,促进智算互联的全面发展。
信通院牵头构建智算互接洽统标准生态,推动互联干系参与方在兼容适配方面的标准化培植,形成基于统一智算互联能力哀求的算力多元化供给体系。当前《智算互联能力哀求》标准体系包括机内互联、多机互联、存算互联和跨域互联四大模块,本次谈论的X-Link互联技能和超节点将作为现有标准体系的关键补充,下一步将联合各厂商完成X-Link互联总线协议标准及超节点各模块的标准制订,在全国智能打算标准化事情组算力互联互通研究组(SAC/SWG32/SG7)完成立项与体例事情。同时,联合产、学、研界代表开展线上/线下技能沙龙,持续洞察家当发展,促进智算互联各方联动。末了,依据标准内容开展干系评估活动,为我国智算互联领域发展供应一套完善的规范评估方法论。

中国移动集团首席专家、中国移动云能力中央科技创新部总经理刘军卫在致辞中指出,AI大模型的发展亟需提升GPU集群算力,而芯片间互联能力是集群算力提升最关键技能之一。中国移动牵头算力网络创新联合体,协同各央企单位、产学研互助伙伴开展联合创新,加速核心技能打破与成果转化,推动GPU芯片、DPU芯片、交流芯片等家当发展。在此过程中,中国移动云能力中央与中国信通院在重大项目方案、标准制订与测评认证等方面深入互助,凝聚家当力量,加速芯片技能创新和工程技能落地,推动办理我国算力发展面临的“卡脖子”问题。
依托移动云异构打算架构创新技能,中国移动云能力中央牵头发起国产化大云磐石弹性超节点的联创操持,包括X-Switch交流芯片模块、X-Link互联总线协议、大云磐石DPU、高性能网络、软件生态5大能力模块。移动云引入交流芯片,实现单机16卡TP并行,卡间互联带宽达到800GB/s;联创X-Link互联总线协议,最大支持TP128并行,布局在网打算能力;利用大云磐石DPU供应机间VPC网络、云盘启动能力;自研高性能网络,实现高精度的拥塞旗子暗记检测能力,可降落拥塞时延,范例“中长流”场景下集群网络性能可提升48%;通过算力原平生台,统一多GPU生态。2024年6月,移动云已完成X-Link互联总线协议初版及大云磐石弹性超节点方案的制订,正在协同互助伙伴进行软硬件研发,共同推进技能方案落地。
会上,家当界各厂商根据自身领域的多年实践履历,为家当标准制订建言献策,同时环绕与移动云互助的创新成果做内容分享。摩尔线程专家在会上先容基于X-Link互联标准的GPU互联办理方案,探索建立GPU网络通信开放标准。复兴通讯专家从单机和集群两个维度先容了基于X-Link开拓的AI做事器,进一步做高带宽池化内存扩展。盛科通信专家分享了基于X-Link在Scale-out和Scale-up两个场景下的下一代HPN网络芯片办理方案。
未来,中国移动云能力中央将连续积极推进家当链高下游联合创新,携手中国信通院和家当界互助伙伴,牢牢环绕做事器、GPU、交流网络、DPU等芯片间高速互联关键技能和超节点项目进行攻关创新,进一步提升算力互联效率的同时推动标准化、规范化,共建国产化算力家当生态,为科技强国、网络强国、数字中国培植贡献力量。