对话恒生电子白硕：大年夜模型不擅长精准计算数据质量决定模型能力

文章目录 [+]

刘曙峰提到，大模型在落地运用时存在着模型选择难、算力供应不敷、运用成熟度不敷等问题。
作为“百模大战”的参与者之一，恒生电子此前发布“金融行业大模型LightGPT”，并在近日发布了最新能力升级成果，以及数个大模型运用产品，同时正式开放产品公测。

在钛媒体App此前的行业调研中，同样感想熏染到了大模型落地金融行业过程中碰着的诸多难点。
比如，当前绝大部分中小金融机构缺少探索大模型的高额预算；“幻觉问题”难以完备战胜，大大限定了运用落地表现等等。

对话恒生电子白硕：大年夜模型不擅长精准计算数据质量决定模型能力对话恒生电子白硕：大年夜模型不擅长精准计算数据质量决定模型能力互联通信

对此，钛媒体App近日与恒生电子首席科学家、大模型产品总监白硕展开了深入对话。
在加入恒生电子前，白硕曾任中科院打算机所博士生导师，上海证券交易所总工程师。

（图片来自网络侵删）

半导体禁令或将倒逼算力互助

钛媒体App：最近大家关注度比较高的是美国半导体禁令，新规可能会冲击英伟达A800或者H800的发卖，对海内AI芯片或带来冲击，怎么看这一禁令后续对大模型行业带来的连锁反应？

白硕：我理解这可能会带来几方面影响：第一，由于禁令的生效，海内大模型企业可能打算买的或者已经在路上的AI芯片，都可能存在一定的风险。
买不到当然便是“无米之炊”，大模型企业想推广的一些场景可能面临未便利推广或者没有那么顺利的问题。

寻衅也带来了另一方面的影响：一方面，国产相应GPU可以快速顶上，达到同步、同功能、等效的更换。
站在这个角度上，确实我们看到一些企业，譬如海光、华为的昇腾都在发力，我也期待他们会供应更加符合客户哀求的算力支持，我们也会一起帮助AI的运用真正在行业落地。
以是从这一方面来看，实在它是一个机会，推动国产GPU的技能进步。

此外，未来还会不会有其余一种可能性，当前海内大模型已经有的算力，可能处于一种分散的状态，不一定能够发挥它最大的效能，已经有的算力节制在少数单位或者少数机构的手里，并不能非常充分地发挥它的浸染。
我们有没有可能把算力集中起来，以行业的办法，统一供应做事？这也是我们在思考的一条路径。

头部机构技能先发上风明显

钛媒体App：大模型的开拓须要大量资金、算力和数据支撑，它会不会拉大头部和中小金融机构之间的技能差距？

白硕：如果从算力角度来看，不同规模金融机构在算力方面投入的差距，可能很大程度上会使这个差距加剧，对算力投入本钱的承受程度各不相同。
但是，如果可以通过行业能力统一的办法来供应算力做事，大家或许都有机会。

另一方面，实际上大模型的预演习、精调和推理支配须要的算力有数量级的差别。
实力雄厚的头部企业研发投入充足，先发上风明显，可以利用相对大的算力和自有数据对大模型进行精调；而研发投入相对有限的中小机构，可以采取跟随策略，直策应用成熟模型，只进行推理支配而不做精调。
像恒生这样的金融科技做事商，可以在打造成熟模型方面为市场供应相应做事。

“行业云+稠浊支配”是未来出路

钛媒体App：最近理解到，中小金融机构的投入预算很少，很多新业务不太乐意考试测验，恒生电子在实践中有若何的履历和体会？

白硕：这有一个“既要…又要…”的问题。
所谓“既要…又要…”，便是既要合规，又要尽可能地不做重复培植。
由于不重复培植就可能意味着数据要素的流动。
如果这个流动不是监管所许可的或者不是公司乐意的，那就会成为问题。

我们都知道SaaS化，大模型的SaaS有一个专门的名词叫MaaS（模型即做事）。
MaaS可以把算力资源最大程度地利用出来，大家可以通过模型订阅的办法得到做事。
但当碰着数据不能彼此互通的情形，这种模式就不太成立，大模型只能私有支配。
以是这里有一个办理方案，便是用“行业云+稠浊支配”模式。
行业云就意味着是行业有公信力一个单位或者一个机构来供应云做事，监管认可的公信力会办理很多问题。

另一方面，稠浊支配将是一个常态化的方案。
采纳私有化支配+MaaS做事相结合的稠浊云支配办法，一方面知足监管合规、数据安全的哀求，另一方面可以快速引入行业资源和能力，完成大模型的运用落地；同时通过订阅做事得到数据做事、AI做事的持续更新。

大模型不善于精准打算

钛媒体App：关于幻觉问题，有人跟我提到过一个不雅观点，大模型的核心上风是创造性，但由于幻觉问题的存在，大模型和金融业会存在实质性的抵牾，当然这里的“金融业”是比较狭窄的含义。
您怎么看待这个问题？

白硕：创造性还是很笼统的观点，详细地说便是措辞能力和知识能力。
大模型最亮眼的表现是措辞能力，无论是意图的精准理解还是内容天生，都非常惊艳。
但是，它的知识能力处在进化过程当中，而且它是有上限的。

像数学公式的推导，还有像知识图谱，中间须要很深层的穿透打算，每一步都须要精准打算。
如果把这些精准的知识放到大模型里，那么就又变概率了，增加了不愿定性。
这不是大模型善于的，这类事情就不应该交给它。
我认为，不应该把大模型的创造性用在这些须要精准打算和推理的地方，用了反而会起反浸染。

而在一些内容天生方面，我们鼓励大模型有创造性，能够做到千人千面。
比如我们问同样的问题，大模型可能可以给到精神同等、但表述不一样、乃至表述风格都不一样的不同回答，这就充分表示了大模型的创造性。

当前我以为还有一个倾向，可能有一些技能职员，或者AI业余爱好者常常在一些业务用不到的点上磨练AI大模型，像脑筋急转弯的问题之类。
我呼吁业内避免走入误区，在选择业务真正须要的场景时，稽核的着眼点不要放在缺点的、没代价的地方。

数据质量决定模型能力

钛媒体App：关于数据的问题。
投研、投顾是大家比较期待的场景，但也有一些业内人士表示，目前为止还没有表示出很出色的表现，数据孤岛化、数据质量不高档问题依然存在，极大限定了运用表现。

白硕：你说的是对的，这里面谁来连通这些数据，是有讲究的。
从我们的实践来看，要有一个类似“光子”（注：恒生电子推出的金融运用对接大模型的“中控”平台）这样的东西来拉通各种数据、各种资源。
比如在财富投顾场景中，投顾话术的天生须要给大模型供应各种数据，比如来自行情数据库的数据、来自基本面数据库的数据，还有来自证券公司系统里的客户自身的持仓数据等。

以是，我们要有一个“中控”平台，能够像一个巫师一样，从四面八方把有用的资源召唤出来，利用在同一个业务场景中。
比如在投顾场景中，大模型可以根据这些资源，进一步进行打算、剖析、摘取、天生，末了形成综合了各个方面资源的投顾建议给到投资顾问。

这是大模型自身做不到的，须要以一种无缝的办法拉通多方面的资源才能做到。
而这些事情正好是我们最善于的。

钛媒体App：目前金融大模型有开源也有闭源，您怎么看待开源、闭源的路径选择？

白硕：开源分为代码开源和参数开源。
一样平常都能做得到代码开源，也便是说真正拉开间隔的不是代码，不是演习和推理的框架，而是数据。
数据可能决定了模型的能力。
以是，用数据这件事情差异还是蛮大的，只管演习和推理框架都是开源的，但只要数据本身有特色，仍旧能够打造具有自己特色的大模型，这是一个我们的基本判断。

如果涉及到参数开源，参数开源意味着你的上家（底座大模型）用它的数据演习过一次模型，得到了一些参数，而你没有废弃这些参数而是继续，然后在这些参数根本上，用你的数据连续演习，把这些参数向效果更好的方向去迭代修正。
在这种情形下，开源参数的质量会很大程度上决定后续的模型质量。
（本文首发于钛媒体App，作者｜蔡鹏程）