大模型或将在金融领域开启“iPhone时刻”
 来源:法治日报·法治周末  更新时间:2023-07-11

■前沿话题

张韶峰

我们正迎来一个以大模型为核心的人工智能新时代。金融是人工智能技术渗透最为广泛的领域之一,大模型或许将在金融领域率先开启“iPhone时刻”(意指革命性的转变时刻)。

自从OpenAI推出ChatGPT大模型开始,通用大模型在全球范围内迎来爆发式增长,市场上各类大模型层出不穷,一时间宛如进入了“百模大战”。但是,澎湃的市场情绪并没有带来应用层面的火热,当通用大模型运用在特定领域内,比如,医疗、金融等,由于缺乏领域内专业和庞杂的知识作为依托,其能力表现往往不尽如人意,大模型发展路径也因此分出一条岔路。相比通用大模型,针对特定行业训练的大模型在垂直领域的智能交互中表现更佳。一个典型的例子是,彭博推出的大模型Bloomberg GPT在实时的金融数据处理等方面超越了ChatGPT,展现出了更强的专业性。市场中越来越多的企业开始将目光投向了垂直领域的大模型,在金融领域这一趋势尤为强烈。

两次AI浪潮在金融领域叠加向前

在展望大模型在金融领域的应用前景之前,回顾一下人工智能与金融融合发展的历史或许能给我们提供一个更加宽阔的视野。

1956年,达特茅斯会议在一个小镇召开,会议首次使用了“人工智能”一词,从此拉开了AI发展的序幕。但此后的几十年间,人工智能发展几经波折,有过高潮,也曾陷入过沉寂。直到时间来到2013年,工程师通过深度卷积神经网络将图像中对象分类的错误率降低到了18%为起点,人工智能才开始又受到瞩目。而让AI真正走进大众的视野,莫过于2016年AlphaGo战胜韩国围棋棋手李世石这一标志性事件了。

与此同时,2013年金融领域也进入了新的历史阶段,互联网金融横空出世了。此后十年,一场涉及到整个金融产业的革命(包含银行、保险、互联网金融、消费金融、汽车金融等几乎所有产业主体)进入了波澜壮阔的十年。

金融产业良好的数字化和信息化基础,为人工智能的发展奠定了基础。人工智能第一次发展浪潮与金融产业在过去十年形成了历史性交汇。

在第一次浪潮中,判别式AI是主角。判别式AI的技术特性决定了它不需要穷尽所有信息,而只需要部分较为精准的信息,即能给出明确的决策结果,进行“好”与“坏”的分类,“是”与“否”的判别,这对于彼时正快速线上化、数字化的金融机构来说,判别式AI可谓占据了天时地利人和。

在判别式AI的驱使下,以银行为代表的金融产业经历新旧范式的转变,金融数字化转型正在各个层面如火如荼展开。经过近十年的深耕和发展,判别式AI为金融机构带来了从文化思维、技术产品、管理流程、业务模式到人才生态等层面的重塑和变革。

以2019年中国人民银行印发《金融科技(FinTech)发展规划(2019—2021年)》为标志,以保守稳健著称的金融机构,完成了对AI从怀疑、观望到全面拥抱的转变。

而当下,以生成式AI为代表的第二波AI浪潮正席卷而来,技术引发变革的广度和烈度都将远超以往。

大模型将为金融产业带来哪些新变化

人工智能与金融的再次相遇,将会带来哪些惊喜呢?

以百融云创为例,百融云创基于深度学习Transformer框架,结合NLP、智能语音等技术,打造了场景驱动的产业大模型——BR-LLM。百融云创自主搭建了大模型底层框架,通过深度微调能支持百亿级参数的训练。

在AI开发层面,大模型展现出强大的代码自动化生成能力。在金融机构中,传统的机器学习模型开发在某种程度而言是一种“手工作坊”的模型,一个场景一个模型,模型之间的经验也不能互相积累和复用。大模型的自动生成能力将颠覆这一现状,面向不同金融场景的业务诉求,通过大模型工程师只需要下达清晰的指令,用文字描述出需求,即能自动生成模型,极大提升机器学习的开发效率和生产模式。开发人员的角色也会随之发生变化,如果说此前开发人员只需要做好技术的工作,有了大模型的加持,开发人员还要做好“提问者”的角色。

在智能交互方面,大模型能提供“真人级”对话效果,对客户的语音识别准确率可达到99%以上。同时,大模型还有“高人一筹”的表现。

比如,当人工向客户推销金融产品时,客户问到一些如近十年某基金收益率这样的专业性问题,工作人员无法及时给出准确的反馈,客户可能就此流失。而大模型跨模态、跨语言的深度语义理解与生成能力,在处理复杂和专业性金融知识上,具有人工所不具备的能力。

一家大型银行动辄几千万的客户,有了大模型的能力加持会为每名客户提供一个7×24小时的专属服务,这将为金融客服、智能投顾、产品营销等带来一个质的飞跃。

在分析决策方面,以判别式AI为代表的小模型已经发挥了重要作用,大模型的进场将进一步激发小模型的能量。

数字化转型的快速推进,使得银行内部形成了大量的非结构化数据,这对信息质量要求比较高的判别式AI而言是一片无法触及的领域。当训练的信息量超过一定阈值,大模型就会出现“涌现现象”,即“在较小的模型中不存在,但在较大的模型中存在的能力”。

大模型能够凭借强大的信息挖掘能力,唤醒金融机构大量沉积的信息,就像是一块巨大的磁石,做关键信息的抽取,为判别式小模型进行赋能。比如,在风险决策、信用评估、反欺诈等场景下,大模型能丰满信息的维度,挖掘出小模型无法覆盖到的区域。大模型对于小模型并非是替代或“消灭”,相反,两者将是相互协作的关系,大模型与小模型相互搭配,将大大提升金融决策的精准度和效率。

大模型“大”非万能

与普通模型相比,大模型具有更加复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模,并不等于更强模型能力。

产业大模型考验的是算力+行业knowhow+模型精调的综合能力。其中行业knowhow尤为关键,这是专家经验、行业数据、组织能力、工程能力的综合体,而这也恰恰是垂直企业的竞争优势所在。

比如,在银行运营环节,由于模型都是黑盒模式,由模型制定出的营销策略,很难让一线执行的客户经理完全信服,当模型制定的策略置于现实情况产生了偏差,此时该如何协调客户经理与AI之间的关系?或者由于外部环境发生变化,如疫情对居民收入带来了影响,金融机构原有的信贷模型与现实情况就会产生偏差,此时要如何优化原有的参数?如果仅有大模型而没有足够深入的产业knowhow,是远远不够的。

比如,在某中小银行的服务中,百融云创要从数字化转型总体规划入手,逐步深入到,产品和业务等多个层面。有时要协同科技部门、业务部门等多个部门,并搭配非常深厚的产业视野,才能真正深入场景,直抵产业的核心。

当然,必须指出的是,尽管大模型具有广阔的想象空间,但大模型这一变革性技术的应用也同样面临着全新挑战。比如,对于很多中小型金融机构来说,很难承担提升算力所需要的巨额资金,这是否会造成发展的分化?如何在保障安全的基础上释放数据要素的价值,如何提高模型的准确度和可靠性,使AI生成的内容安全、可信、可靠?这些都是在推动大模型产业化落地亟需各方努力破解的难题。

(作者系百融云创CEO)


责任编辑:谢婷

版权声明:版权所有,未经授权,请勿转载或建立镜像,违者依法必究。
本站违法和不良信息举报电话:185 8629 6259

蒙公网安备 15010502001696号 蒙ICP备16001043号-5