陆志鹏表示,当前天生式人工智能的发展将面临着绿色低碳的巨大寻衅,根据国际能源署(IEA)估算,由于天生式人工智能快速发展等成分影响,2026年环球数据中央耗电量最多将达到2022年的2.3倍,达到620-1050太瓦时。在传统算力能力已靠近摩尔定律极限和数据量以指数级持续增长的双重压力下,软硬结合的体系优化是应对绿色数智发展寻衅的最优办理路径。
中国电子探索构建基于数据元件的数据算力根本举动步伐,设计形成了由数据金库、数据要素加工交易中央、数据要素互联网等组成的根本举动步伐总体架构。数据元件是通过对数据脱敏处理后,根据须要由多少干系字段形成的数据集,或由数据的关联字段通过建模形成的数据特色,具有安全属性、代价属性和质量属性,可有效提升数据代价密度。
基于数据元件构建的数据算力根本举动步伐具有提高超大规模数据处理能力、提高大模型的运用性能、超大规模数据处理能耗最低的特色。在提高超大规模数据处理能力方面,作为数据算力根本举动步伐核心之一的数据要素加工交易中央,是集软、硬件于一体的大规模、全流程、自动化的数据元件加工生产掌握流水线,具备超大规模数据的处理能力,能够有效提高大规模数据的处理效率。

他表示,在提高大模型的运用性能方面,通过对数据洗濯管理形成样本数据,利用样本数据进行调试,演习好的元件模型能够加载全量数据天生数据元件结果,大大提高了大模型的利用性能,同时降落了大模型发展对算力的花费。以11.8万字的文档为例,通过加工成元件后,能够得到4.07万Token的预演习元件,比较其他表征办法同比降落70%,再利用同样的文档加工出3000余个微调QA元件,对领域大模型进行演习、微调后,大模型回答流畅程度、准确定、专业性均有大幅提升,有效回应了绿色数智的发展哀求,切实以数字化赋能绿色化,共塑低碳未来。
南方+ 郜小平
【作者】 郜小平
【来源】 南方报业传媒集团南方+客户端