2023年金融科技趋势展望.docx
《2023年金融科技趋势展望.docx》由会员分享,可在线阅读,更多相关《2023年金融科技趋势展望.docx(17页珍藏版)》请在课桌文档上搜索。
1、PmfeceIr大模型是数字经济时代智能信息处理的基础设施,它的基底是语言生成模型和语义理解模型。它的语义生成空间非常大,可驾驭空间磔E常大、创作自由度高,但是它的自由度太大了,当试图去完成某种真实任务的时候,会由于可控性不够而导致困扰,它的优点反而变成了它的弱点,所以未来要在“可控生成上面下功夫。大模型的最主要特点是以机器易驾驭(machine”ctbe)的方式,即自监督学习的方式博览一切,因广博而产生能力。如果将它的能力放在金融行业中去处理原有的任务,性能和效果将会有显著的提升。如果把各类金融大数据注进大模型去做经济形势的预测,与现有的主流经典分析方法论将会有质的区别,国际上如果因此出了一
2、个诺贝尔经济学奖(将人工智能用于金融研究或预测),我一点都不感到惊奇,甚至是可期待的。孙茂松清华大学人工智能研究院常务副院长、ACLFeIIow近期智能计算和智能网络的重大技术突破,依然是深度学习为我们带来了惊喜。从算法角度来讲,首先最有代表性的是深度神经网络,以及预训练模型方向得到长足的发展。预训练模型有一个巨大的神经网络,最新的版本在千亿级参数量,知识深度和广度都让人叹为观止。不论从研究角度,还是应用角度,预训练模型都产生了重大影响一从图灵测试的角度远超过之前的测试,并且具有行业普适性,它可以适用到各种各样的下游Al的任务中去,这是它最具里程碑意义的地方。其次是生成式模型,它所代表的机器创
3、造性也是智能的重要体现。从网络角度来讲,算力是最大的瓶颈,不论是边缘的算力,还是中心化的算力,从目前统计来看,它们的使用率是比较低的。怎么样能够提升它的使用率,还需要一些新的技术,能够打通中心的算力以及整合边缘的算力,使得这些算力能够满足普适的Al的算力要求。除了算法和算力外,数据也是支撑智能计算和智能网络发展的重要因素,尤其对于金融行业来说,数据的使用和安全更加重要。隐私、安全和公平性是最需要关注的三个话题,隐私保护计算、联邦学习、数据的选择和算法改进,分别能够一定程度上解决上述三个问题。此外,从治理角度来看,区块链作为一种基础设施,也是数据治理的重要技术手段,目的是对数据和其他资源进行分布
4、式的自治化治理。郭嵩香港理工大学计算机系教授、IEEEFeIIow1短期内人工智能总体还是会保持大模型、大数据、多数据源、多任务的发展趋势,通过大规模算力堆砌实现接近甚至超越人类的精度。但我们也注意到,数据驱动的人工智能可能无法突破弱人工智能的极限,我们还是应该积极探索数据之外的内容,比如客观规律等知识,将其结合到算法中,实现更好的人工智能。原!阳之江实验室图计算研究中心副主田高级研究专家(?(?I数据分析或者机器学习,对于理解、发现以及使用因果是不可或缺的。这个时代我们有足够多的数据,而且计算资源非常丰富。显然,机器学习一定可以帮助我们更好地理解、发现和使用因果关系。这也是因果表征学习最近几
5、年才提出来的原因。其次,我们希望用因果的思维方式去看待机器学习,这样可以帮助我们从传统的只是基于预测的机器学习,走到更高维的层面,走到理解、可信任、可干预的人工智能发展层面来。因此,理想状态下,这两者相互促进之后,可以让我们有一个基于数据进行学习、有一个很好的表述机制,同时能让人理解并且信任,可以进行合理干预的系统。张坤卡内基梅隆大学哲学系和机器学习系副教授I当前,金融行业数字化、智能化转型正在加速,数据和人工智能技术是关键驱动要素,人工智能技术在金融行业的应用必将革新金融行业的现有服务模式。基于图计算、多模态等技术对于大数据的深入理解?口洞察,降低了金融机构风险管理的成本,扩大了服务人群的边
6、界;因果推断、AutOML(自动化机器学习)等技术让业务决策更智能,RPAx情感计算、数字人等技术让金融服务更有温度,提升了用户的服务体验。人工智能在金融行业的应用潜力目前可能只发挥了不到1%,随着技术商业应用成熟度的不断提升,人工智能技术将改变金融行业价值链的每一环节。许冬亮度小满CTo创造性任务,别开蹊径:生成式人工智能,新一代生产力工具识别和控制。近年来,借助深度学习,研究人员在自然语言理解、数据挖掘、展奠定基础深度学习作为机器学. 通过学习给定数据存在的on创造性人工智能/生成式人工智能目 前依然处于实验阶段,尚未出现商业化 雏形。生成式人工智能远没有达到替代 人的境界,其所输出的内容
7、,暂时没有 形成人的逻辑和情感。此外,此类生成范等也存在很多问题需要解决。TheatreDoperaSpatial夺冠;,AIgetscreative”入选Science2022年的年度十大突破;DALL-E2、ChatGPT和AIPhaCode横空出世,因其具有创建和生成超逼真内容的AI能力而迅速走红2022年,上述事件背后所代表的“生成式人工智能(GenerativeAl)技术,吸引了大多数人的眼球,以及科技企业和资本的大量资金投入。人工智能此前被更多的用于处理机械的数据任务(判别任务),而生成式人工智能陆续证明能够输出富有创意性的内容,不仅极大地降低了内容(文字、语音、图片、数据、视频等
8、)产出的边际成本,还提高了创作效率。2001,自然语言处理:2013,深度学习i2017,画分习-2018,对抗性神经网络2021,生成式预训练模型GPT-3I20221A瓒娓生成*上述技术入选麻省理工科技评论十大突破性技术,为当前大模型出现和生成式人工智能的发现对文字、语音、图像等内容的感知、个性化推荐等领域取得了显著成果,而基于深度学习的大模型也成为实现高维人工智能的主流选择。但对于诸如GPT-3、BERT这类备受关注的TranSfOrrner模型来说MetaSJS人工智能科学家杨靖(YannLeCun)认为:它们是必要的,但并3最充分的这可能是未来智能系统的一组成部分。“在金融领域中,通
9、过指令,生成不同风格的文字、语音、视频,以及生成一种类似于金融资产标的内容,是它最基本的应用。生成文字、传播文案、语音、图像、视频等,可以用在智能营销、广告等业务场景中,还能够用在客户服务、用户交互、售后服务中。生成式人工智能在金融业务落地层面有一定的直接价值,从生成过程和结果角度来讲,带有创造性质。因果推断:人工智能和机器学习的下一个前沿领域,更高维、值得信任的、有自主性能的人工智能的基础角度去看因果推断。统计学对因果关系的研究,分为两类:一类为因果推断,目前,机器学习算法和模型很擅长于寻找模式、相关性和关联。但它们不能告诉我们:是这个因素导致了那个结果吗?或者如果我做这些事,那么将会发生什
10、么?所以在计算机科学中还有一整个关于因果推理和推断的领域。几十年来,统计学界一直在研究因果关系。因果关系是人工智能和机器学习的下一个前沿领域。周以真(JeannetteM.Wing)因果关系一般指的是两个事件之间的一种作用关系,其中一个事件会导致另一个事件的发生,前一个称为原因,后一个称为结果。统计学、经济学、社会学、教育学、流行病学等领域均对因果关系做出了研究。在医学中,通过操控实验寻找病因是医学界最常用的因果检测方法。因果推断则是一个更为广泛的定义,指跟因果关系有联系的、跟数据有关的、基于技术的因果研究。传统的因果研究主要做因果推断,指从一个因果图和数据里面找出一个变量怎么影响另外一个变量
11、(Identificationofcasualeffects),关注这个问题的研究学者聚焦用因果图以及结构方程这个另一类为概率因果论。人们对因果关系的理解普遍建立在概率因果论之上,所以会容易把相关性当作因果性,因为机器不能很好地分辨内生性问题。随着深度学习和大数据的发展,人们对于事物背后的关系探讨也早不止步于相关关系。近两年,关于因果发现,或称作因果表征学习(CausalRepresentationLearning)的研究和应用逐渐变得更加活跃,它们与机器学习的关系更为密切,因为传统的因果推断是只知道了因果图、看到数据之后去分析一个事物怎么影响另一个事物。但是一个很重要的问题是,如何从数据中找
12、出因果图以及隐变量,这也是因果发现和因果表征学习的主要目的。我们目前用在机器学习、人工智能、机器视觉里面的数据,很多时候不是结构性数据,更多可能是视频数据或者图像数据。这种情纳,我们看到的变量本身书间未必有直箴)辱嘛口俚后是由一些因凄的金H山藤碣血何从这种非结构化的数据里面把背后真正存在的因三它们的关系找出来,是因GTQOCQ长期以来,JudeaPearl是因果论、因果推断的推崇者。当前开展因果推断的两种代表性方法是以DonaIdB.RUbin为代表的结构因果模型和以JUdeaPearl为代表的因果图方法。而现实应用中,如何去把数据背后的过程信息恢复出来,是让机器和人进行高维智能互动的重要技术
13、支持。在解决实际问题、将因果推断应用到行业中去时,理解实际问题的基本性质是研究因果学习的第一步。因果研究跟传统的机器学习有很大的区别。传统的机器学习,例如预测,在意的是最优性,不管数据之间噪声有多大,只在意预测的结果是不是最好的。但是因果研究有另外一个性质很重要一一要保证得出来的结果跟背后的真相是吻合的。因此需要在不同的领域、针对不同的问题,将因果过程或因果的约束条件变成技术上可用,同时去证明表达出来的事件和事实是吻合的,这就需要因果推断比机器学习付出更多的理论研究和技术上的努力。具体的场景应用中,因果研究需要关注具体问题的一些性质。要想恢复出来因果性,需要知道有哪些数据、里面哪些性质是可以用
14、来恢复因果性的。不同情况下的数据需能够恢复什么样的因果性,是完全不一样的。所以我们就需要从实际问题出发,去理解这个问题里面的性质之后,再针对这类问题思考如何能找出背后的事实真相。因果推断的本质就是从产生的数据里面回推背后的真相,既然它的在不同数据里面表现出来的性质不同,显然,我们就需要针对这种性质,寻找如何有一种方法很适合的方法,去回推背后的因果过程。在金融行业中,因果模型是智能营销的关键手段,能促成最大化全局营销效率。但金融数据是非常复杂的,如果想要因果的研究方式能真正发现很多我们不知道的可靠信息,一定需要对金融数据的性质有一个很深入的认识。再将目前的分析方法做一定的调试修改,才可以把系统背
15、后的因果性找出来。因果推断领域当前最需要进行深入研究和拓展的两个方向,一个是因果表征学习,需要让机器能从各种数据里面找出背后有意义的表征。机器必须走到这一步,人类才能信任他,才能做到所谓的可解释AL这是从人工智能的角度来思考,如何能得出一个特征提取的方法,或者是如何表述数据的方法,使得人可以信任机器的处理方式。第二个则是针对一个具体的实际重要问题,如何能把这个问题解得更好,需要开发专门的因果表征学习或者因果发多模态情感计算:为人工智能决策提供了优化路径情感计算(AffectiveComputing)是一个快速兴起的交叉前沿学科,涉及计算机科学、脑与心理科学、社会科学等学科。由于深度学习等人工智
16、能领域的技术突破,作为人工智能和认知科学的结合,情感计算在商业、管理等领域有许多前景广阔的运用,近年来更是成为理论研究的一个热点。在情感计算领域,运用最多的理论模型是情感分类理论模型,主要包括离散情感模型和维度情感模型。在理解式和生成式大模型的支撑下,情感计算的准确度上有望提升,这对金融领域的应用无疑是有益的。提供各类信息技术手段和工程化能力, 对情感的感知、识别、理解、反馈 等实施数字化重构和计算实现,从而 使机器能够拥有类人情感心智功能计算机科学提供关于人类情感的基础定义、相 关要素结构存在的意义等方面的理 论,这为情感理论建模构筑了基石为情感计算的应用提供了充分的“用 武之地,是该类技术
17、应用场景设计 的策源地及建立与情感相关的心理要素功能N 网络,为开发情感计算模型提供了/乙 关键的启发和策略指导 /t心飒意识领域人在表达和传递情感信号的时候,通常通过多种方式输出,如文本、语音、表情、肢体信号、生理信号等,研究人员针对上述相应的数据开发了分析算法和工具,赋予机器感知、识别、理解情感能力。为了更精准的识别人类所表达的情绪,多模态融合算法利用来自不同模态的信息和数据来合成多模态表征。在金融场景中,情感计算有助于了解客户的真实情感表达,可以收集客户情感信息、识别客户情感变化,并作出相应的决策指导,对于提升金融企业的服务质量和效率,起到了重要的辅助作用,长期应用在客户服务、催收等场景
18、中。银行催收必须符合监管要求,识别用户情绪非常重要,例如当用户情绪非常激动的时候,(机器)应停止催收动作,否则会出现高投诉率。情感计算承担了辅助测谎功能,综合用户语音的分析,提炼出语速、语气的变化,分析说话者的情绪、是否犹豫等,判断有无明显说谎特征,通过多因子综合判断说话者说殳U如果可唬g断:逾期还款的理由是比较真实的,金融机赚、圃户还款逾期,助手太明显说谎特征,图计算:高维数据治理方式、深度释放关联数据价值, 力技术+场景两手抓,助益实现从有人用到大规模用当前对于图(Graph)的理解和应用,可追溯到数学分支图论。图计算则是以“图论”为基础,对现实世界进行图结构的抽象表达,以及一切基于图数据
19、的分析和计算。图计算行业涉及提供底层能力的图数据库、图计算引擎厂商,以及应用开发商和软件集成商。图计算的优势,一是表达方式,图符合人的思维方式、更符合世界万物本来的样子;二是图在当前数据分析中发挥的作用,即无监督学习,本身图可以自动化发现一些难以通过规则和经验所能发现的东西。本质上,图数据比单纯的数据存储更贴近应用层,图未来在数据治理层面上要高于关系型数据库。业务中能够应用图计算能力的前提:具备深度关系网络,以及是否需要对复杂关系做可解释的分析,金融业务及其所产生的海量数据,天然具有这样的属性。过去十年间,中国开始出现提供图计算能力及下游开发、软件集成的企业直接2021年开始出现了商业化机会。
20、在金融行业的实战应用:图计算技术最清晰的应用效果是智能信审、资金流向查询和金融数据可视化。金融行业每天都有海量、关联的、动态时序数据产生,利用图技术,业务人员可以毫秒级得到查询结果。利用图计算技术,可以在金融场景中实现实时地找到最完整的路径。在数字支付、数字服务、数字金融等核心金融业务中,可以显著提升风险行为的实时识别和调查分析效率。知识BBaIR篡改文本文本信息信息消歧分国抽取1合文本结构化文本关询(8S自动分类SR别可视化秒枇图I图计算技术用于智能信审,提升了直询和评估效率(来源:度小满)(3)设计新型图1型和高能效图计算体系结构及系统L研究 期关注复杂的图1目前图数据库主要适用的金融场景
21、有两类:一是对时效有极高要求,希望快速分析并得到结果的场景;二是对分析深度有要求,如一些区块链金融客户希望对数字货币交易可追踪不只深入到几十步,而是上百步甚至上千步。实际应用也会遇到一些技术上的挑战。例如大多数图计算系统的使用方是银行中的研发人员,其在第三方提供的图数据库或图计算引擎上做二次开发。但银行系统有一定的特殊性,从技术语言、架构、再到网络,开发人员要做更多技术层面上的兼容工作,包括国产芯片的兼容。图计算领域近期关注的研究和应用重点:(1)如何对于一个十亿级或者是百亿级的大规模图数据,快速高效地学习出图中每一个节点的象量表示,即所谓的图深度表示学习。在既有图数据库或者是有了图数据库支撑
22、的数据后,如何更高效地对图数据进行挖掘,做一些机器学习或深度学习任务。(2)图数据上的预训练技术,尤其是自建构的预训练。预训练最近在Al学界和产业界,比如视觉、自然语言处理方面都有很大进展。如果在图数据上,可以有一个预训练出来的通用模型,这个模型所生成属性、特征,就可以自动应用到下游各个机器学习应用当中,那将可能节省下游诸多开发团队的尝试和努力。(3)高性能计算。当前5万亿点边、10万亿点边规模的图数据越来越普遍,这让通信量猛增,对算力资源的需求变大。将高性能计算研究与图相结合,更好地提升计算效率,是当前非常棘手的问题。(4)考验深入走进业务的能力。懂技术但不懂业务,是典型的思考方式与技术先行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 年金 科技 趋势 展望

链接地址:https://www.desk33.com/p-645395.html