虚拟交易_微众银行人工智能首席科学家范力欣:基于内容严谨的数据库查询和校验,可防范大模型“幻觉”
- 时间:
- 浏览:55
- 来源:虚拟币资讯网
每经记者 张宏 每经编辑 廖丹
7月2日,微众银行“大模型时代AI前沿与金融应用”主题活动在北京举办。
会上,微众银行人工智能首席科学家范力欣表示,模型越大,能力越强,随之而来的问题是高成本,尽管现在“百模大战”,用户成本可能越来越低,但使用和训练大型模型的成本实际上并没有降低,这为大模型应用落地带来挑战。
会后,《每日经济新闻》记者(以下简称“NBD”)就如何防范和纠正大模型“幻觉”、银行业大模型落地面临的挑战、数据要素与大模型之间的关系等问题专访了范力欣。
图片来源:每经记者 张宏 摄
基于内容严谨的数据库查询和校验可防范大模型“幻觉”
NBD:在金融机构中,数据精准度至关重要,因此有人认为生成式AI不适合应用在金融机构的核心部门。针对生成式AI可能出现的“幻觉”问题,你认为可以如何进行防范和纠正?
范力欣:在技术层面,可以基于内容严谨的数据库查询和校验。目前,这一过程已经在实际应用中得到实施。
首先,在生成内容之前,(生成式人工智能)需要先查询信息。当查询来源为网络时,信息的可靠性参差不齐,查询结果的准确性并非总是能够得到保证。但在(金融机构的)实际应用中,所依赖的是内容严谨的数据库,这构成了第一层保障。
其次,生成的内容需要再次与数据库进行校验,以确保生成的内容与数据库之间不存在矛盾。这是技术层面上的第二层校验。
在流程层面上,我们的系统并不直接面向实时生成业务。以客服为例,客服背后有一个庞大的数据库支撑。以往遇到的问题是,数据库中一个问题对应一个答案。随之而来的难点是如何将同一问题千变万化的问法与数据库中的答案对应。现在,(有了生成式人工智能)可以扩展问题的表述范围,使其能够覆盖用户未来可能的表述,从而达到答案与问题的“多对一”匹配。由于数据库是离线的,并且可以人工审核,从应用层面避免了“模型幻觉”问题。
NBD:刚刚你提到的数据库是银行内部的私域数据库吗?
范力欣:是的。实际上,包含两个数据库:第一个是事实材料库,也称为背景库,它用于查询和联合校验。第二个数据库是面向服务端客服的问答库。这个问答库原本是一问一答的模式,现在已经发展为多问一答的模式。
NBD:校验的过程由模型完成,还是由人工完成?模型在校验过程中会不会出现“幻觉”?
范力欣:大模型校验。但最终会由人工审核,就像一支人机混合的足球队,大模型是前锋,攻城拔寨,人工审核是后卫守门员,保证不失一球。
投入产出比为大模型应用落地带来挑战
NBD:人工智能的发展对金融机构人员专业占比有没有影响?
范力欣:微众银行拥有超过50%的科技人员。在这些科技人员中,涵盖了我们通常所说的ABCD各个方面,即人工智能(AI)、区块链(Blockchain)、云计算(Cloud)以及大数据(Big Data)。目前,这些技术领域已经基本融合。
NBD:大模型落地目前还面临哪些挑战?
范力欣:虽然大模型在技术上有广阔的想象空间,但我们必须考虑投入产出比。小型模型可能能力不足,而大模型可能具有质的飞跃,但随之而来的问题是成本也可能有质的飞跃。银行是高度数字化和信息化的,理论上完全可以使用该技术。然而,银行必须计算投入产出,许多小企业也同样关注这一比率。任何企业首先考虑的是生存问题,而成本控制是首要的考虑因素。
目前,大模型带来的微小收益可能已经被其额外的成本所抵消。因此,现阶段我们只能筛选那些产出大于投入的业务。对于其他业务,我们可能会进行简单的尝试或评估,以确定是否可行。当大模型到达另一个阶段,能力更强、成本更低的时候,将有更多可能的业务亟待拓展。
NBD:目前哪些应用在投入产出比上有优势?
范力欣:目前在投入产出比上具有优势的应用主要包括生成视频、生成图像以及营销领域。除此之外,还有对客户进行评估和判断的相关应用。这些都是可以进一步开发的领域,但有时候不一定要使用大模型。
NBD:你提到联邦大模型,借助联邦大模型似乎可以达到数据可用不可见。数据要素市场建设有没有可能与人工智能相融合形成1+1>2的效果?
范力欣:我们的理解是,关键不在于数据要素,而在于模型要素。为什么这么说呢?数据本身如同原油,可以提炼为柴油、汽油等多种形态,只有当数据被纳入一个有效的模型中,数据才具有可用性。虽然这个比喻可能略显粗糙,但可以理解为,原始数据有多种潜在用途,在具体用途不明确的情况下,我们无法对数据进行准确的定价,只能根据数据的规模和大致质量进行初步估计。
然而,更精确的定价应当面向应用。只有当我们明确了数据的使用目的,以及它在实际应用中带来的帮助,我们才能评估其真正的价值。否则,同样的数据对某些人可能毫无价值,而对另一些人可能非常有用。
这种应用价值的评估需要通过模型来实现,即通过训练或微调,使数据得以有效利用,从而揭示其真正的价值。从这个角度来看,实际上是模型赋予了数据价值,就像羊吃了草之后,我们是对羊定价,并向客户提供羊的使用价值。
封面图片来源:视觉中国-VCG41N1419339719
专访远东资信研究院副院长彭澎:信用评级为促进新质生产力的生成培育发挥积极作用
猜你喜欢