产品展示
风起时刻:金融大模型初探

发布于:2024-06-05 11:13:54  来源:产品展示  点击量:14次

  ChatGPT引发全球轰动后,生成式大模型给各行各业带来的影响还在持续。从概念爆火至今,历经一年多的摸索、前行、突破后,金融大模型落地成效如何?应用场景能否继续拓宽?能否在未来为金融领域带来看得到的生产力变革?这样一些问题备受业内关注。

  立足金融行业,国内的科技公司、高校、金融机构纷纷加入赛道,推出了不少大模型产品。时隔一年,各家机构在细节上有了不少进展:微软公司近日正式推出为金融业工作人员服务的聊天机器人CopilotforFinance;蚂蚁集团打造的消费金融风控体系,把风险挖掘、风险识别和风险打击的速度提升至秒级;度小满轩辕大模型能将征信报告解读出40万维的风险变量,用来识别小微企业主的信贷风险;腾讯为金融行业打造的OCR大模型的特点是,金融机构可以不再经过检测、识别、结构化等多个阶段进行定制,而是利用大模型自带的阅读理解和推理能力,直接通过TI平台对OCR大模型进行精调;马上消费推出金融大模型“天镜”,对知识助手、智能营销交互、数据决策、防伪安全等八大应用场景进行定制,提升金融服务的普惠性;工商银行、农业银行等多家银行已推出自研大模型平台辅助智能风控、智能运营等场景;东方财富、同花顺等互联网证券平台也发布了金融对话大模型。

  金融大模型的运用旨在替代行业内部分生产力以及提高效率、节省本金,有很大的想象空间。国际数据公司IDC的调研显示,超半数的金融机构在2023年投资AI大模型技术。上述微软的AICopilot项目的主要客户就是银行、对冲基金、信贷机构,预计将为其带来100亿美元的收入。不少接受《金融时报》记者正常采访的专业技术人员认为,大模型将给金融业发展的深度和广度带来改变。不过也有专家觉得,考虑到大模型数值能力及金融行业对精准性及隐私方面的特别的条件,相较某些行业,短时间内,金融行业难以彻底利用大模型进行变革。此外,大模型风险需要有相应的技术应用规范和监督,相关管理部门应加强规范。

  大模型如今慢慢的变成了金融领域热门话题之一,尽管商业化应用还比较有限,但业内人士均认为其发展的潜在能力巨大。清华大学经管学院发布的一份报告数据显示,生成式AI正在席卷金融业,释放新的生产力,以前所未有的方式重塑全球金融业的格局。

  “金融行业数字化基础好,高度依赖数据和技术,是大模型落地的高潜力场景。”作为行业探索者,度小满首席技术官许冬亮在接受《金融时报》记者正常采访时说。予以佐证的是,麦肯锡报告分析认为,在AI助力下,2025年中国狭义消费信贷余额将从约15万亿元增至约29万亿元,实现翻倍增长;广义上,AI大模型也有望给金融业带来3万亿元规模的增量。

  在某些细致划分领域,金融大模型已经展现出技术优势。上海金融与发展实验室前沿金融研究中心主任、万向区块链首席经济学家邹传伟在接受《金融时报》记者正常采访时表示,大模型将使文本信息更有效地进入金融市场,有助于解决在金融建模中文本信息输入不足的问题。大语言模型从文本信息中提取的信号,可当作定量模型的输入信息。例如,通过大语言模型对美联储新闻发布会、公开市场委员会纪要的解析,能为美国国债量化投资提供重要参考。在信用评估中也出现了类似的应用方法。有大型保险公司科技部门相关负责人告诉《金融时报》记者,大模型能在7×24小时智能客服、自动化销售以及承保理赔服务方面发挥作用,给客户提供更为个性化的服务体验,这对于与人交互场景甚多的保险行业来说有着重要意义。

  基于这种优势,国内金融机构在去年提出了不少构想,并在逐步探索。工行、农行、中行、交行及招商、中信、兴业、华夏、浙商等9家银行明白准确地提出正在探索大模型的应用。2024年年报中,中行、建行、农行、交行等银行对大模型均有着墨,表示将快速推进大模型应用,探索内部知识服务、辅助编码、智能客服、调研报告生成等功能。例如,建行提出,截至2023年末,已实现自动生成上市公司类客户调查报告等25项场景应用,其中,智能客服工单生成每单平均节约客服上班时间15秒至20秒,可用率达82%,一致性达80%。网商银行表示,已在小微经营认知、产业链认知、理财客户挖掘等场景中探索AI大模型应用,通过大模型搭建了包括汽车、医疗、建筑等在内的9条产业方向的产业链图谱,小微信用画像效率提升了10倍。

  安永大中华区金融服务高增长市场主管合伙人许旭明在接受《金融时报》记者正常采访时表示,在基础能力建设方面,一些银行持续跟进开源大模型技术发展,探索用自有语料调优、训练、适配银行场景,自研百亿参数大模型,有的银行选择与头部企业合作,联合建立金融科学技术创新实验室,通过引入主流开源大模型,培育“大模型+小模型”的核心能力,目前,一些银行已具备信息总结、推断和扩展、文本转换、复杂推理、金融知识等能力。

  在保险领域,目前,中国人寿、中国平安、中国人保、泰康保险、众安保险等众多保险公司和保险科技公司已开始围绕保险大模型的研发及应用进行布局,涵盖客户服务、销售支持、智能理赔等场景。

  总体来看,由于大模型开发与应用成本不可以小看,自研型大模型集中于自身实力丰沛雄厚及科技能力领先的部分少数机构。

  据浙商证券测算,自研型大模型的资金投入包括高达56亿元的固定成本以及每年1.7亿元的电费成本,其中不含研发人员薪酬和维护成本,且开发周期和质量都难以预期。例如,此前有新闻媒体报道,GPT4使用了1.8万亿巨量参数,训练一次就需要6300万美元。所以,对大部分机构而言,做大模型私有化部署加微调,可能是相对成本最低的方式,目前科技公司的报价约为数千万元。

  “目前,公司大模型投入主要源于两部分,一是算力投入,另一个是技术团队的投入。”某寿险公司相关业务负责这个的人说,在适应保险业务多变和复杂的场景中,公司需要平衡模型性能与资源成本之间的关系,这要求大家对技术发展趋势要有较为准确的前瞻性预判。

  垂直领域的数据是大模型应用的关键,现阶段大模型的应用发展以“问答助手”为主。

  例如,农行人工智能研发团队打造的类ChatGPT的AI大模型应用ChatABC具备领域级知识理解和问答能力,已在该行内多个渠道以多轮问答助手、工单自动化回复助手等形式面向内部员工开放试用。在保险领域,“阳光GPT1.0”于2023年上线,注入保险领域的专业数据,并完成了初步的专业能力建设,目前正处于第二阶段,已完成在车险全线上销售机器人探索性的验证,问题解答率达到91.12%。相较传统AI模型,该模型在理解和推理方面的能力提升10%至15%以上,在信息抽取、意图识别、智能问答等方面准确率均大幅度提升。蚂蚁集团通过“仿金融专家多智能体协同推理”让智能客服具备逻辑能力。针对“汽车分期付款怎么办”之类的问题,智能客服会细致到车辆类别、用户偏好等多个场景,历经十多个推理环节,最后给出建议。蚂蚁集团表示,在用足够多的高质量指令集进行微调后,蚂蚁金融大模型已经掌握95%的金融意图识别,达到专家水平。

  除此之外,金融大模型还可应用于营销、服务、运营、办公等领域。例如,交通银行积极探索大模型在办公助手等场景的应用;邮储银行已上线科学技术研发需求编写助手;马上消费“天镜”大模型在企业知识库的应用中,知识产出效率提升了150%,在与重庆某银行的合作中,大模型驱动的智能营销能将人工成本降低80%以上,产能是传统人工产能的6倍以上。“除‘问答助手’外,机构还在智能投研、智能客服工单生成、营销创意和文案自动转化、合规审查、智能风控、辅助编码、消保投诉管理、统计和监测等场景进行探索。”许旭明说。

  金融行业涉及的业务数据类型复杂多样、体量庞大,高效率的数据处理与高价值的数据挖掘是金融行业的重要需求,而大模型在核心环节如风控等领域的应用面临很大挑战,还在小规模的试水中。

  不久前,蚂蚁集团提出了“大模型+知识+服务”驱动的架构,以金融专属任务评测集“Fin-Eval”为基础,在万亿量级Token的通用语料基础上,注入千亿量级Token金融知识,构建金融大模型内核。其可信AI的技术架构“蚁鉴2.0”能够应用于包括反欺诈、反洗钱、企业联合风控、数据隐私保护在内的多个消费金融场景。腾讯为金融机构提供一站式MaaS服务,金融机构可根据不同细分场景的业务需求,灵活选择各类大模型,降低大模型使用成本。东风日产融资租赁借助腾讯云的风控大模型,在只有较少样本的情况下完成了定制化风控建模,建模时间节省了70%。

  邹传伟认为,从文本如公告、政策文件等识别出市场信号和市场情绪,用在投资中会很有前景,例如,东方财富、同花顺都推出此类大模型。不过,邹传伟认为,目前来看,当下推出的金融大模型应用仍然基于对自然语言的统计建模,使用场景与自然语言处理(NLP)类似,突破较小。另外,金融是强监管领域,不能有虚假信息和陈述。而大语言模型本身不具备金融知识,没有推理能力,或许没有办法解决“幻觉”问题。

  那么,大模型能否提高银行审贷、风控效率?能否重构保险的销售、服务、理赔等核心业务流程?

  “金融业是大模型应用的重要战场,金融机构纷纷入局,搭建平台、训练领域模型、探索场景应用。”太保集团数智研究院院长王磊表示,大模型技术仍在演进过程中,尚未形成成熟的技术解决方案,在产业应用的深度、广度和效果上仍需突破。

  虽然大量数据让金融业产生大模型、运用大模型具备天然优势,但毋庸置疑,由于对数据准确性要求比较高,通用大模型存在的“幻觉”问题、计算准确性问题、遗忘问题等,都不足以满足金融行业的客观要求。马上消费AI研究院副院长邓伟洪认为,大模型的成功依赖于算力、算法、数据、工具、人才等方面的持续沉淀和能力突破,需要更长时间的积累,短期内或难看到跨越性变化。

  “金融特别是证券领域对真实、准确和完整陈述有严格要求,虚假记载、误导性陈述或者重大遗漏会面临严厉惩罚。”邹传伟说,“大语言模型存在‘幻觉’问题,通俗来说就是‘一本正经地胡说八道’。因此,大语言模型应用于金融中需要经过严格的调试和测试。”他举例称,摩根士丹利在研发生成式AI产品中,结合超过10万份财务报告、内部资料和金融文献等,对OpenAI公司提供的基础模型进行了微调,再经过内部1000多位金融顾问几个月时间的测试和试用,使生成式AI产品的性能和效果达到金融应用标准,确保不会出现虚假或非法信息。

  业界怎么样看待金融大模型运用所遇到的难点?农行人工智能研发团队用“天边还有‘三朵乌云’”来概括:一是技术选型难。大模型技术加快速度进行发展,且持续向小型化、组件化方向发展,提高了大模型基础选型的难度。二是可信使用难。大模型基于概率推理,难以保障结果知识的准确性,且知识更新依赖大模型训练,成本高、效率低。同时,大模型作为一个黑盒模型,在模型公平、数据安全、隐私保护等方面的合规应用还需要持续探索。三是场景拓展难。大模型作为一项新技术,涉及底层框架支撑、模型训练、数据收集标注、知识库构建等诸多难题,模型训练不收敛、数据质量差、标注成本高、场景发掘难等,都制约着大模型的有效应用。

  《金融时报》记者通过调查了解到,为提高结果的可信程度,“有迹可循”是目前不少金融机构采取的一个方法。

  邓伟洪向《金融时报》记者介绍:“为最大限度消除‘幻觉’问题,马上消费大模型一方面在技术上要求大模型所答的内容限定在某些数据库、知识库,不能漫无边际发散;另一方面,我们通过合成数据不断反向训练大模型。多管齐下解决大模型的精准度问题。”信美相互人寿相关负责人也表示,与市面上大模型交互处在“黑匣子”不同,“Chat-Trust3.0”推出大模型应用自研“白盒化”展示,能在问题回复时清晰地展示推理过程。“保险产品和服务通常涉及复杂的风险评估和决策过程,‘白盒化’模型应用能更好地向监督管理的机构、客户和内部团队解释其工作原理和决策依据,在问题溯源及准确性的考量上可以更为清晰透明。”该负责人表示。

  金融领域涉及大量的客户数据和敏感信息,毫无疑问,数据安全是金融大模型应用的一个重要挑战。

  “金融本身是一个高合规要求的行业,加上大模型是颠覆性的新技术,我们对其风险还没有完全了解,监管部门对其落地应用也比较审慎。”许冬亮表示,随着《生成式人工智能服务管理暂行办法》落地实施以及大模型落地的不断推进,如何平衡大模型落地收益和大模型风险控制,是一个越来越突出的问题。

  “目前,大模型金融应用可能面临自主可控、数据安全、伦理失范等方面的风险。”北京国家金融科技认证中心总经理张海燕表示,金融属于强监管行业,需要严格遵守法律和法规和监管需求。大模型金融应用在算法可靠、个人隐私信息保护等方面面临更高要求,一旦非合理使用,易引起生成错误信息、内容违规、侵犯版权、用户个人隐私信息泄露等风险,并可能会引起客户资金损失。

  接受采访的专家一致认为,由于金融制度的差异,国内无法完全照搬国外的金融语料、金融知识,加之前述提到的金融服务对专业性、精准性要求,金融大模型在丰富数据种类、强化数据治理、提升数据质量、保障数据安全、完善数据共享机制等方面任重而道远。

  业内的共识是,在数据端要做好数据筛选和清洗,提升数据质量;在应用端要做好应用管控,防控业务应用的风险。

  针对数据质量提高以及数据合规使用,金融机构采取了一些方法。“通过前期实践,我们大家都认为大模型在文本、图像等领域的AIGC能力优势显著,但当前阶段并不成熟,仍存在科技伦理风险等问题。”工行首席技术官吕仲涛表示,因此,短期内不建议直接对客户使用,应优先面向金融文本和金融图像分析理解创作的智力密集型场景,以助手形式,人机协同提升业务人员工作质效。

  另外,据邓伟洪介绍,马上消费对合规问题的解决分为线上和线下两方面。线上措施主要有设置黑白名单、产品化配置等,总的来看,过程分为五个环节:训练数据、生成过程、后置处理、智能质检、人工反馈。在挑选训练数据环节,将大模型的对话数据经过内部合规质检系统过滤,再按照每个用户的负反馈和双方情绪态度模型等过滤不合规的、效果不好的训练数据。生成过程环节中用生成参数、提示信息等对模型来控制。后置处理环节用一些关键字和小模型进行过滤;智能质检环节则是将大模型当成一个特殊员工对所生成的对话进行“质检”过滤。由于质检系统往往不足以满足需求,例如,不存在违规但该对话质量不好或者疑似负情绪样本等,因此加入了人工审核和标注环节,通过人工迭代调整,确保对话数据质量;某用户表示遭到了电信诈骗,该问题不在模型解决实际问题清单里,此时就需要转给人工来处理。

  不过,大模型具有潜力这一事实依然被认可,政策方面也给予了明确的支持态度——去年,国家网信办联合国家发展改革委、教育部、科技部、工信部、公安部、广电总局发布了《生成式人工智能服务管理暂行办法》,从适合使用的范围、管控要求、鼓励导向等方面明确生成式大模型的管理要求。具体到金融领域,中国人民银行印发的《金融科技发展规划(2022-2025)》提出,将数字思维贯穿业务运营全链条,注重金融创新的科技驱动和数据赋能。

  上海金融与发展实验室主任曾刚认为,针对大模型发展,监管需要与时俱进。同时,监管手段也要变化,针对AI时代和金融科技特点,优化和更新传统的监管工具。此外,监管制度探索需要相对超前,增强前瞻性。