2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx
大模型行业应用分析报告北京市人工智能北京市科学技术委员会、中关村科技园区管理委员会二。二四年四月目录编写说明-00-综述-05-一.大赛开放多维度场景及高质量数据,大模型企业奇招频出"°0(一跟务领域0*®.赛题情况'0*'.企业解决方案亮点°0(二途融领域-°*1.,-兄”.0。,企业解决方案亮点*0(三产业升级领域赛题情况.企业解决方案亮点9"(j,*e0*。一赛题情况一。.企业解决方案亮点©/(五淡化教育领域*5。.赛题情况*5。.企业解决方案亮点一(六)8禁城市领域.赛题情况.企业解决方案亮点.二、北京市人工智能大模型行业应用情况分析-O0-(一应用特征-OO-。由浅入深,大模型穿越边缘场景,向核心场景挺进0-.守正獭,央国企翔蹒技术,加快大模型在产业升级、金融等领域的落地步伐.百花齐放.大模型应用搭建难度下降.旬态行业大成为落地。5g÷.QQ-g9305g“。g新关键OO体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明5.保驾护航,大模型安全逐渐受到策视,为可持续发展提供保障(二应用挑战e算力需求持续增长,挈时大模型落地应用一知识产权、数据除私与大模型应用之间的最佳平衡点仍在探索中.大模型幻觉问题有所改菁,但距离规模落地尚有差距.部分大触!应用处于何用阶段.需求方和技术企业协同发力让回ff1.53S1.辆5.部分领域受监管影响,对大模型落地提出特殊要求(三应用研判.政务领域.金融领域。产业升级领域。.医疗领域5.文化教育领域智赫城市领域结语致甜声明附录写说明编写说明大棋型是指通过在海量数据上依托强大算力资源进行训练后的完成大量不同下游任务的模型。大模型以其在模型精度和泛化能力等多个指标上超越传统A1.模型的表现,以及JR能千行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向。大模型经过一年多的高速发展,已在政府、医院、学校、企业等各类需求群体中建立初步认知。其中一部分需求群体设立专项预算、开放业务场景.对大模型进行试点应用。通过试点应用,需求群体加深了对大模型能力和价值的认同感,进而普遍希望在未来继续增加相关预算,将大模型与实际业务进行更深入、更广泛的融合。在此背景下,北京市科学技术委员会、中关村科技园区管理委员会会同有关部门和相关区举办了北京市人工智能行业大模型创新应用大赛,并依托大赛成果及前期工作积累编写本报告,致力于分析北京市大模型行业应用发展趋势,促进大模型价值传播和供需对接。限于煽写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影响,内容或有疏漏,敬请指正。综述d源市税粮布人工智IB,加速推动产业夏展I人工智能大模型经过过去一年的发展,行业应用开始出现井喷式增长,作力发展新质生产力的垣要引擎,人工智能正成为经济高质发展的最大增。北京市委市政府高度电视人工智能发展.0。年5月,北京市政府印发北京市加快建设具有全球影响力的人工智能创新策源地实施方案(0-0。5年R,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发羽晾市促迸通用人工智能创新发展的若干措施b,强调开展大模型创新算法及关健技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。近年来,北京市积极布局人工智能产业发展要素,通过部署智能算力平台、建设数据基础制度先行区,发布中文互联网语料庠、设立产业投资基金、建设大模型产业集聚区等一系列举措,加速推动人工智能产业发展。截至目前,全市人工智能相关企业均900家,约占全国四成的年人工智能产业核心产值突破500亿元。北京人工智签领域越新和产业链条完整,在基咄设施层面集聚了寒武纪、摩尔线程、昆仑芯等国内头部企业;核心技术及算法屋面拥有百度、智诣、百川智能、月之暗面、零一万物等代表性基础大模型,目前已备案上坡大度型5。款,全国第一;应用层面拥有猿力科技、中科闻歌、瑞莱智慧等行业大模型技术企业,相关产品已在教育、金融、政务等领域率先应用。北京市以行“大新亶用大赛为振手全力推动大模超技术应用落地为进一步加强重点领域大模型裳设,根据市委市政府整体部鲁,在市人工智能专班的统筹调度下,北京市科委、中关村管委会会同相关单位,国绕重点行业领域,研究建立全市行业大模型应用推进工作机制,并于eo年月举办北京市人工智能行业大模型创新应用大赛,全力推珠模组技术应用落地。以期通过大赛,挖掘一批典型的行业应用案例,启发一批潜在试点单位拥抱大模型技术.梳理一批核心业务场景,开放一批行业核心业务数据,发现一批有潜力有实力的大模型技术企业,推动一批大模型供需之间的交流与合作。大赛设覆政务、金融、产业升级、医疗、文化教育、智点城市个赛道,分初赛和复赛两个阶段。初赛阶段类似“自由创作',针对参赛团队所申报的应用案例,BS绕商业价值和社会效益进行烁合评估:复赛阶段类似,命题作文”,结合试点单位真实业务需求,由试点单位出题,对通过初赛的大模型技术企业进行能力考核。历经数月,大赛从。个赛道00余家参赛单位中,征集应用案例。0余项凝练应用场景5个.开放高质量行业数据上万条。本报告以大赛为切入点,展示了北京市大模班技术在各领域各行业的应用方向,根据不同领域对大模型应用趋势进行分析研判,并提出工作建议,力求向市场各类参与主体呈现北京市人工留能行业大模型创新应用发展态势.为未来决策提供参考。大模型企业奇招:出TO政务领域.赛题情况方向一为基于多形态知识的政务认知智能体系研究,由北京市政务服务和数据管理局提出,以构建高质政务数据知识体系为核心目标,需要参赛企业对全市海政务数据的实时动态挖掘、清洗.标记、转换,并打造大模型测试训练的蜕一平台接口。复赛所用训练及测试数据集由公积金、交管局等政务知识数据脱勖成.可供参赛企业带回,迸行部署调试。该方向将有助于进一步提升政务服务数字化、智能化水平,在政务愁体场景布局中发挥大模型数据中台作用,从而支撑政务领域各项业务的大模型应用。方向二为基于依申请政务服务里项知识图谱的智能咨询,由北京市政务服务和数据管理局提出,以提升办事企业、群众在统政务咨询及申请办事的体脸为核心目标,需要参赛企业针对用户提出的依申请办事相关咨询问题进行精准回答,并锁定服务事项。复赛所用训练及潴试数据集由政务服务事项办事指南、事项说明等数据形成,可供参赛企业带回,进行部詈调试。该场景从形式上属于大模型智斓问答,是市政务服务和数据管理局面向大众群体的重要场景,需要大模型精准把控生成内容的同时保殴用户的良好体验。方向三为面向政策分析场景的政策专业化标注,由北京市政务服务和数据管理局提出,以为政府办事人员提供政策分析问答、指导政策制定为核心目标,需要参赛企业对政策性文件进行条款拆解、理解并训探大箱型,获得准确的问答效果。复赛所用训练及测试数据集由专M新的政策原文数身形成,可供参赛企业带回,进行部詈调试。该场最需要大模型深度理解政策原文对其拆解及标注,并在政策制定的过程中给出参考意见,将有助于提升政策制定的效率及全面性。.企业解决方案亮点在提升回复准他率方面,参赛企业提出两个较为有效的解决方案。部分参赛企业通过外挂知识庠的检索增强(RAG历法来索引政策知识,从而提升大模型生成错果的准确性,弁且可行性较强,但这种方案依赖知识库的知识储备和及时更新,在长期运维过程中不仅带来额外的人力成本也可能生成大量重复、过期的知其部分参赛企业利用大模型来对知识进行分析和存储,相比于外挂检索增强.这种通过大模型对知识迸行管理的方案虽然在短期内可能会因为大模型幻觉等问题在答案精准性上有所欠缺,但长期看,陨着基座大模型霞力不断提升,这类方案地够真正的理解数据,从而更好的更新和利用知识,在开展垂追领域微调后表现出更好的效果。参赛企业在提升用户体览方面也做出了多维度的尝试,从部署上,参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部詈,为数据敏感的政务场景提供解决方案。在提升准确度的考虑上,接赛企业利用知识图谙辅助大模型精准定位知识,并通过主动多轮质询用户的方式提升答案质量。s金融领域.赛题情况方向一为豆于A1.GC技术的智能审计合规研究,由北京银行提出,以提高审计工作效率和准确性为核心目标,需要参赛企业什对检查内容.利用大模型技术寻找并给出相关现象涉及的制度名称及相关原文,生成包含检查要点、检查方法等内容的审计合规方案。复赛所用训练及测试数据集由北京银行制度、监管政策以及历史问题库等内部审计合部相关知识形成,仅允许本地私有化部署。金融审计场景作为北京银行的核心业务之一,对审计结果的正确性要求很高,对大模型的检索能力及溯源能力提出较高要求。方向二为基于金融行业的营销引导式智能员工,由北京首创融资担保有限公司提出,以错助业务人员迅速生成风险报告,评估企业风陵情况为核心目标,需要参赛企业对金融场景的数据进行理解并训炼大模型,最终生成包含产品特征、贷款担保资质、项目方案(预估放款金S1.担保费率同问我的解决方案。复赛所用训炼及测试数据集由企业画像、业务评审报告等文件数据形成,仅允许本地私有化部署。金殿担保同时具备金融性和中介性双重属性,为完成融资担保流程,担保公司不仅需要熟悉了解金融专业及法律规定,还需要具备一定的蓄销能力,因此本题目方向覆羞了金融领域的端到端需求,对大模型在金融领域的综合能力提出了较高的要求。.企业解决方案亮点外挂知识昨的检索,技术(RAG同于提开金!大B的回鲁M)MOMM.RAG在使用语言大模型回答问题之前,从外部知识库中检索相关信息,为大模型回答提供外部知识支撑。金融领域业务具有较强的专业性,RAG技术的运用可以让大模型更好的应对知识图集型任务,不同企业在RAG的基础上可以对检索方式进行扩充,从而更准确的命中外部知识,提升回答的精准度。化对齐技术在金IMM发筹要作用.未经强化对齐的模型可能会输出不符合金融行业风格甚至计算错误的结果。金附领域对结果的合规性、专业性要求很高,利用强彳匕对齐技术的参赛企业在本次比赛中表现更好。1产业升锻领域.赛题情况方向一为基于多形态、多维度、多场景数据的企业成本智能化分析及预测,由中都物流有限公司提出,该题目方向以提升物流服务领域企业成本分析和预测的智能化水平为核心目标,需要参赛企业基于企业成本相关的数据集、社会面的数据集开展大模型训练,形成企业成本颈测和分析的大模型智能工具。复赛所用训炼及窝试数据集由中都物流提供的线路成本、台账'运营成本等数据脱敏形成、可供参赛企业羽数据带回,进行部署调试。该赛题以企业成本分析为核心目标,本身属于企业数字化转型的任要部分之一,大模型的分析及生成摘要能力.在此场景下有较好的应用空间.将有助于企业智能化决策.帮助企业把控成本。方向二为区于联通业务数据的运营商行业大模型研究,由联通(北京产业互联网有限公司提出,该题目方向以实现运营商业务数字化、办公智能化升级,提升运营商企业服务能力和效率为核心目标.需要参赛企业竹对用户提出的运营商领域相关咨询问题进行精准回答。复赛所用训练及利试数据集由与联通公司相关的媒体报道、产品和方案介绍等内客组成.涉及大数娓、云计算、物联网、区块链、安全、人工智能、产品介绍、解决方案、公司业务等方面,可供参赛企业将数据带回,进行部署调试。北京联通作为北京市的主导通信运营商之一,用户量庞大,每天有海的用户咨询和业务服务,以大模型技术驱动的智能助手将有望在众多运营场景中藕助客户服务和业务合作,实现降本增效的效果。.企业解决方案亮点”企"通过大MS1.号*方4»搭配解决气条业务耳量网产业升级领域的场景覆盖范围相比于其他领域更加广泛,更看重大模型产品的综合能力,比如在成本预测方面,模型需要更为强大的计算能力来得到准确的结果,而在数字化转型方面则更看重模型的理解及生成能力,因此多家技术参赛企业根据不同细分业务的具体需求选择合浦的模型进行处理,通过大模型与专有模型的合理搭配,形成大模型全产业链解决方案。!EH医疗领域.赛题情况方向一为基于大模型的策症医学领域多源知识体系搭建及临床辅助决策,由北京协和医院提出,该题目以提升重症医学领域科研效率和临床辅助决策能力为目标,需要参赛企业整合重症医学领域专有的指南、文献等数据,构建重症医疗领域高质知识际,从文献知识问答、专业知识考试、重症患者辅助诊断三个维度考察行业大模型能力。复赛所用调练数据集由重症医学领域知识文献、操作指南、专业试题座和入院病历样例四部分银成,不涉及患者临床信息,通过脱敏处理后,可供参赛企业带回,进行部署调试。该赛JS领向于将大模型作为辅助工具,利用大模型的理解和索引能力为医生的科研工作提供帮助,利用大模型的推理能力提供辅助诊断建议.因此该题目方向需要大模型全面无遗漏她生成内容,从而帮助医生迸行判断。方向二为大模型驱动的疑难肝病可解释精准诊断平台构建及应用,由苜都医科大学附腹北京友谊医院提出,该剧目以建设面向复杂肝病会诊场景的可解释智能诊疗系统为目标,研发能筋实现医生和智能体多方.多轮辩论的会诊方法和平台。需要参赛企业构建肝病诊疗智能体,实现对肝SE疾病的初步诊Bi;增强智签体的学习和辩论能力,实现人机联合诊疗最优决策,提升复杂肝病会诊决策准确率。复赛所用训练数据集由友谊医院提供的电子病历、实验室检变指标、腹链影像数据报告的半结构化脱敏数据组成,因数据保密的相关要求,仅允许参赛企业在医院内部进行私有化部署调试。该赛就期待大模型差幅作为一个专业的肝病医生,在复杂的医疗数据中自动化形成确诊,因此对于大模型的专业性及精准住要求更高。.企业解决方案亮点数是决定星疗大Itm性的关!秦.模型训练及测试过程中,面粉不同程度的金标准数据匮乏,少错误数据对医疗大模型的不良影响潍以评估。参赛企业充分利用经专家治理的互联网问诊、全流程诊疗、医学科研、医学知识图语等高版量数据,构建超百亿Token的医学数据集,提升医学领域大模型姜力。长期深耕医疗行业、积58丰富息础医学知识和深入了解医疗场景应用需求的企业研发的医疗领域大模型统合能力更强。助音疗要求*疗大sm备可解哥利可雳源动不同疾病专科的诊疗思路和治疗方式差异大,但共同点是明确诊疗依据.加强诊断准确性。如重症医学诊疗需要大模型辅助提示尽可能多的诊断.用助排壹病因;肝病等专科疾病诊疗需要大模型提升诊断准确率,并具备可解释性和诊断溯源功能。部分参赛企业基于枳果的通用医学知识预训缘大模型,采用多Agent+ReAct思维链跟曲的结构,提升大模型诊断准确性,并补充发现和解器患者可能存在的疾病,得到医疗专家的认可。:文化教育领域.赛题情况方向一为大模组支持下的课堂师生行为精准分析,由北京市第二十中学琨出,该题目方向需要参赛企业对海量课堂数据进行实时动态挖掘、清洗、标记、转换,并打造大模型测试训练的统一平台接口。精准分析课堂教学过程中的师生行为,获得定量的课堂观察数据,解读课型教学过程,为指引老师改善教学方法提供数据依据。复赛所用调练数据集由第二十中学课堂录像数据脱敏形成,数霜包括学生、教师、交互大屏等相关视痰文件,以及课堂音频文件,可供参赛企业将数据带回,进行部詈调试。本题目看重企业对视频关键要素的识别与蜕计,不仅考察了大模型的多模态理解能力,也为后续大模型应用打下教育视频分析的区础,在当前教育行业大模型应用尚未成熟的阶段,该题目可发挥从智能化教育到大模型教育的关健过渡作用。方向二为基于大模型的数智图书馆员服务,由首都图书馆提出,该Ifi目方向以提升首都图书馆对外交互式自助服务水平及读者借阅体编为核心目标,需要参赛企业针对读者提出的知识杳询、智能问答、图书推荐等相关咨询问题迸行精准回答。复赛所用训练及测试数据集由首都图书馆图书借阅信息等数据脱敏形成,包括读者卡号、借还书时间、题名、责任者、出版社、出版年等信息和读者咨询相关问答知识弹,可供参赛企业科数据带回,进行部署调试。该场景应用模式可以复刻于其他图书馆、博物馆寻,开展针对多模态资源的应答式咨询服务等延伸场景。数智图书馆员应用交互利用大模型快速准确的语义识别优势解决了图书馆读者咨询时程中问题泛化的问施,同时结合应用内容快速提供给读者正确方向的内容和知识,让读者互动更接近于人与人之间的交流,让回答更加贴近用户群体。方向三为面向运动员训炼指导场景的大模型技术研究及应用,由北京市体育科学研究所提出,以形成个人专属运动训练基叱模型为目标,迸一步提升运动员训练的数字化、智能化水平,需要参赛企业针对运动员的个人血液生化测试数据与体成分测试数据,应用大模型提供贴合运动员自身的饮食、营养、训练方案;根据个体特征和历史数据迸行智能分析,提供个性化的健康建议,帮助运动员在训练和比赛场上保持最佳状态,预防潜在的健康风险。复赛所用训练数据集由运动员近三年的血液测试、体成分测试、血液报告.体成分报告等原始数据组成,经脱敏处理后,可供参赛企业将数据带回,进行部署调试。此外,北京市体育局为体育方向选题提供了多个方案,分别是运动员竞技状态监测及管理、运动员技术训绘指导、基于人群和个体层面的体质监测评价和健身指导,覆或了市民、运动员、体育爱好者多种角色。.企业解决方案亮点裁写Ht耳+多路召回方案是提高大IUKjKBB识利效果的关.由于图书馆客服是面向大众的应用场景,因此多家公司加强了大模型的意图识别能力以应对不同客户的多样化问题.其中改写/扩写解决了对模糊提问的意图识别,多路召回则对意图进行了多维度的拆解.从而更准确的去对数据遂行索引,两者培合最终提升了大模型的输出结果精准度。部分参赛企业在考核训炼中利用基于A1.反馈的强化学习技术(R1.AIF),在原有人类反馈强化学习(R1.HF网齐技术提升主观行文质的基础上,解决了原有方法数据标注时间长、数据标注成本高、特定人群难以寻找的问1.三,极大提升了数据收集与标记效率,同时大幅度提升了模2!输出的安全性。IH智城市(城.赛题情况方向一为针对人工智能生成内容进行伪造检测,该题目方向以生成基于人物伪造视频、图像、音频的真伪检冽工具为目标.探索深度伪造检测技术路径。需要参赛企业面对伪造视频、图像、音菊信息进行高精准、高时效的检测发现。复赛所用训练数据集分别为人物真实音视频图像及人物伪造音视频图像,可供参赛企业将数据带回,迸行部署调试。本JS目主要考查大模型对人物的识别能力,针对视痢、音频、图像内容的鉴别真假能力,以及大模型向垂追领域造配所使用的技术手段。方向二为针对社会面热点话题进行煤合分析,该题目方向以提升热点话题分析报告撰耳及人工检索效率.提升报告内容准确度为目标。需要企业精准实时抓取首发媒体和全网媒体报道总量、热度信息,形成高质量热点话题分析报告。要求生成报告内容符合逻辑、语序通顺、热度准确、观点分明。复赛所用训练数据集为针对社会热点话题撰写的综合分析研判m告.主要内容包括标朝、绿述、?2度统计、媒体报道情况等,可供参赛企业将数据带回,进行部署调出本题目主要考核大模型的信息检索姜力、总结归纳能力,以及辅助决策能力。方向三为自动化红队大模型技术,以发现当前大语雷模型存在的漕在生成歧视、偏见等不良内容的漏洞,援解当前测评大语言模型过程中传优方法和提示词有效性不足,判断结果半自动化等问题为目标。需要参赛企业研发红队大模型,用户在输入原始种子提示词后,模型最终自动化生成更多提示词,通过将提示词输入目标测试模型,从而发现目标模型生成不良内容的漏洞。复奏所用训爆数据集为根据不同的风险类别构建的红队模型提示词样例,可供参赛企业将嘘带回,进行部詈调况本题目主要考核红队大模型生成提示词的攻破成功率、语义相似性、流畅度.以及对种子问题的转化能力、对风险类别的理解能力、对大语言模型漏洞的发现能力。.企业解决方案亮点敷理处利于京21.集成是提升送率的关.特定人物伪造视频、图像的鉴别需要向模型提供大数据作为前置积靠,大部分企业采取对训练数据进行随机数据增强、构建伪造数据训练集、使用随机搜索参数调整方法进行训练等手段,向模型提供清洗后的数据。但面对震杂多变的实际应用场景,仅仅做好数据预处理并不足以支撑最终效果,而是应在此基咄上建立多模态之间的联系,解决单一模态鉴伪能力缺失的问题。部分尊赛企业在考核训练中创新性地采用了基于多因子融合的伪造音痰检测、基于多模态时空特征差异的伪造视频检测等手段,克服了伪造图多元素蛆合丑化、单一因子鉴伪检测能力不足、模态间时间域特征差异导致视频音频不一致等技术问施.有效提升伪造人和特定人的识别准确率。二、J像市人工智能大Iffi行业应用情况分析JTO应用特征.由浅入深,大模型穿越边缘场景,向核心场景挺进军,为W集中于闻心H1.大模型兴起于O。年初,经过近一年的高速发展,其在政务、金融、产业升级等各个领域均有落地应用。大模型在政务领域,以政务问答、文件生成等场景为主;在金融领域,以智能客服、售前助理等场景为主;在产业升级领域,以知识问答、代码补全等场景力主;在医疗领域,以医疗文书生成、笛靛医药问答等场景为主;在文,匕教育领域,以内容润色、内容纠错等场景为主;在留慧城市领域,以公共安全监测、城市运行报告生成等场景为主。但上述场景大多为明i领域的边缘场景,不涉及生产'运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用O年,大aw承向被心用量近逢得益于大模型在边缘场景价值的成功验证及其技术演进,大模型在深耕边缘场景的同时开始向核心区挺进。在场景价值蚣证方面,多数需求方认可大模型价值,将计划追加投入O例如某运营商在。年研发客服大模型并试点上线,由数万名贰内测试用.该运营商计划O年开始在集团范围内加快涣模化商用推广。大模型技术演进主要指检索增强生成(RAG).智瞬(A1.Agent刖多模态,他们对犷大大模型应用范围有明显作用。检索增强生成技术是指大模型在回答问题时,会先从大的文档中检索出相关信息,然后将这些检索出的信息作为提问的上下文构建提示询,大模型再基于提示词迸行归纳总结,生成答案,检索增强生成技术主要用于解决大模型幻觉问题。智的体技术则可以实现大模型应用的能力升级,例如.类似ChatGPT的大模型应用仅能起辅助作用,而智能体技术可以信予大模型感知、规划、记忆和使用工具的能力,实现独当一面。多模态技术使得交互模态不局限于单一的文本横花.而是扩展至文本、图片、音频、视频等多种模态.可显著提升大模型应用的产品功能和交互体验,推动大模型应用从可用向好用转变。边爆场景核心助量大横盟WMtt产线优化WB«(W»).守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐大m在各个3相落山&用,其中在产*升量利金IM城的落5H他eo年公开招投标统计数据显示,产业升级相关大模型项目招标金额最多,占比高达®e.5%,金融占比累除其后,占比为eee%(>央企求e,引*f1.在两大皿愧I*央国企守正翎新.有较强意愿自上而下推进大模型应用。同时.央国企通常具有较强的数据基础设施、算力投入和A1.应用基础,为大模型成功落地提供先决条件。在央国企引领下,大模型在产业升级和金觥领域快速落也百花齐放,大模型应用搭建难度下降,'动态行业大数据”成为落地新关键大MStt肋提升、开复工具皿制|.为增W大MaU谢滕±1.大模型持续迭代,语义理解、上下文长度、多模态等能力愈发完善,有利于开发上层应用。同时,随福行业发展,大模型生态也在逐渐成熟.各类便捷的A1.开发工具陆蝮推出,应用开发难度显著下降。例如百度于2024年推出的智能体开发工具AgentBUi1.der、A1.原生应用开发工具AppBuiIder.各种尺寸的模型定制工具MOde1.BUi1.der,可以帮助不具备代码姐程能力的人员完成大模型应用开发。动蠢行3M虞为大f1.*新关口基础大模型一般是基于广泛的公开文献与网络信息来训级的,属于发行业,没有特定行业属性,导致基于其搭建的上层应用在专业和细分领域难以提供高价值服务。因此,打造行业大模型成为需求方和技术企业的共同关注点。具体而言,句点行业大数据"是打造行业大模型的核心,其是指为保证行业大模型的持久生命力,技术企业应具备动态更新行业大数据的能力,而非只掌握一批游态3孀'°拥有动态行业大数据做技术企业更容易荻得需求方I1.s1.量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明求方EK力«,«向果Jga大«ia,反之剜假向采购大I1.a1.m,需求方IT能力差异显著,这会直接影晌他们的采购行为。强IT能力的需求方帧向能力建设,较弱IT能力需求方便向应用建设。聚焦大模型.强IT签力的需求方通常倾向采购基础大模型,通过自行急调来开发各类上层应用。IT能力稍弱的需求方通常顿向采购“企业大模型”,即由技术企业基于需求方数嘉对基础大模型进行徼调。IT能力更弱的需求方通常1®向采购大模型应用,实现小箱即用”,由技术企业对基础大模型进行调整和封装,需求方无需关心。求方IT传为1»,IM备在年中NGr化大条件,反之更依大Im一体机制公常云强能力需求方通常已自建智算中心,其具各高端GPU资源,支持大模型的训练和推理工作。IT能力稍弱的需求方通常采用大模型一体机,其仍为私有化部署模式,由技术企业对大模型、应用、算力资源迸行整合,形成端到斯解决方案,便于大模型在需求方快速落地。11能力更弱的需求方通求慎向公有云部署,此种方式更省心且初始投入较低,有利于需求方低成本快速试错。»MX.11*M保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障大调震艮康用常及国奥参与主体,均存在安全求.大横型开发及应用全流程通案涉及数据提供方、大模型应用使用方、基础大模空提供方、大模型应用提供方四类参与主体。它们在合作过程中需要解决信任及隐私安全保护问题。数据提供方面临数据使用过程中的各种不安全因素;大模型应用使用方担心在使用过程中泄露核心业务数据,该担心并非空穴来风,例如202年三星设备解决方案部门因使用ChatGPT导致半导体设备测量、良品率,缺陷、内部会议内容等相关信息被上传到ChatGPT服务器中,造成广泛负面舆论;基础大模型提供方面临模型产权被窃取风险,特别是对于初创企业而言,基咄模型是公司的核心资产;大模型应用提供方面临微调参数成果泄露风险。1.aasxx三asa,为可持mimhe.在大模型行业发展初期,各参与方聚焦大模型、算力等方面,对安全性重视程度不足。随着行业发展逐渐深入,各参与方的安全呼声越来越高。反映到技术企业端,B有一批企业推出大模型安全类产品,为可持续发展提供保网。品应用挑废。.算力需求持续增长,掣肘大模型落地应用大模型被为是建立在充沛算力之上的黑力美学二随着大模型兴起.市场上算力需求则增。不论是公共算力还是企业自建算力,尚无法完全满足大模型企业对于智能算力的需求。随着大模型应用地更深更广,算力紧张情况预计仍将延续。特别是大模型在训练环节需要大组算力集群,但市场上存在较多分散算力,难以用于大模型训练,加剧了算力紧张情况。力.知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中知识产权保护与大s凶用之间的法律平誉点仍在探索中.大模型训练涉及的数据可能包括一些版权保护的作品,从知识产权保护的角度而三,可能需要禁止使用.避免生成侵权回答。但是.这些作品数众多、来源各界'权展不同,若采用事先授权许可的方式,这一过程漫长、复杂且几乎无法落地操作。敷看保护与大wfi用之网的技术平告点仍在掾索中.对于数据隐私保护和大模型效率之间存在着一个两难的矛盾值要最大限度地保护数据陇私,又要最大限度地发挥模型的效果。在政务、医疗和金腼城,该矛盾尤为突出。通过开发可信的框架.从而在数据隐私保护、模型效果和调蝶效率之间取得一种平衡,是业内的重点讨论方向,但仍在探索中。.大模型幻觉问题有所改善,但距寓规模落地尚有差距大SUMt网是影行业大Iut在部分”,康用的关政务、金融、医疗等领域对大模型输出内容的专业性、准确性有较高要求,对不准确回答的容忍度较低。例如在政务领域,面向公众的政务问答一且生成错误的答案,将给工作人员带来额外的解辨成本。方ImWWm的方沫,>ratM三fi尽管当前较多大模型技术企业采取引入提示词工程或外挂知识庠等方式进行内容校准,在一定程度上可以媛解大模型幻觉问题。但是,这种方式一定程度上限制了大模型的通用泛化能力,难以从根本上解决幻觉问题。.部分大模型应用处于“可用阶段',需求方和技术企业协同发力让“可用”迈向好用”需求方在输出内容的专业性、准确性等方面要求较高,特别是在政务、教育、医疗等领域,尤为明显。当前大模型落地的各类应用大多处于可用阶段。这也导致需求方主要让内部员工使用大模型应用,而不对外服务。虽然现阶段大模型应用不能完全符合需求方实际业务要求,但需求方已经从早期试点过程中看到了大模型价值和可持续优化的潜力。因此,多数需求方有意愿携手技术企业继续深耕大模型应用,推动其从可用迈向好用,让大模型的价值在员工群体和客户群体中得到嚏量释放;.部分领域积极响应监管需要,对大模型落地提出特殊要求金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应.在凝练场景、开放数据、模型训练等过程中考虑监管因素.在项目交付时考虑所属领域可能存在的特殊要求。例如部分需求方为了保证数据不出域,可能要求技术企业采用驻场微调的方式。!H应用研判。.政务领域款务*xa3用丰富,但公共性多.商化落你力不&政务领域作为社会服务的核心,业务背景包含大量政府数据及社会信息,主要工作包括公文撰寻、政策研究、服务民众,因此政务领域从数据积累和业务需求上都适合大模型落地。当前政务领域已经在核心业务上初步形成产品,以政务助手的形式对不同来源的文件(如政府报告、政策法规等处行分析、总结,并形成公文素材。然而,归因于政务领域落地周期长、准确度要求高、经济效益较低等原因,对企业的成本和技术挑战较大,令不少大模型企业望而却步。目前从事政务大模型的企业主要有以下两类:一是希望在政务领域打造大模型标杆应用的头部大模型企业;二是前期政务领域系统的技术服务商,在原有系统中扩展大模型功能。款务胡大IttuE期内施以具警"回向公众提供Uk务何答的力.政务问答对准购度要求极高,一旦生成错误的答案,将给工作人员带来颔外的解拜成本,这种风险尤其存在于审批和执法过程中。对问题理解有误、生成内容不准确、关联政策信息过时等问题普遍存在,大模型的幻觉问题短期内难以得到显著改善,在部分业务中尚不满足面向公众提供精准政务问答的条件。在政务领域,有三条发展建议。一J1.1.t在款务内部优先应用大超,建洌B向公会开放.短期内在政务领域落地应用方向主要是面向政务工作人员内部使用。在该场景下,应明确大模型作为政务助手的定位,引导技术企业重点提升大模型的溯源能力及汇总能力,为用户提供多角度建议以及参考出处,辅助政务工作人员得出结论,通过优先落地内部业务的试点应用为后续实现更高智能化水平的政务大模型打下基础。随着不断测试验证,当模型能力满足一定条件后,逐步探索面向公众上蛟月膨。二是加颂缝务粽杆案例,箔成全行业示范效康.政务大模型应用重点提升的数据分析及总结功能具有行业普适性的特点,能够横向迁移至各行各业的办公场景中,应把握政务领域数据成熟度高、质量好的优势,从政务领域选取公文揍写、办公助手等落地效果好.可推广性强的案例进行推广,向社会各界释放政府主动拥抱大模型技术的信号,对齐各行业对大模出效能的认知,带动政务细分领域以及其他行业领域逐步接纳大模型应用。三是大m技术企”和政务IT解决方案供应育优劣直扑,协网WSm1.政务领域对于技术供应商的行业经验、技术实力、综合实力等方面有较高要求。大模型技术企业在与政府部门合作方面的经验可能比较欠缺.而专注政务领域的传统解决方案供应商在大模型技术方面的能力较为薄弱。双方优势互补,有利于满足政务领域客户的需求。.金融领域金IHMUM大棚f1.的市用央动力较立,且偌合点较多.金融属于高工作效率可以带来高回报的行业,金融机构为了追求更高的工作效率更及时的决策分析,往往愿意为能显著提高效能的大模型产品买单。从实际落地角度来看,大模型可以和金融机构现有的软件系统.模型较好融合,相辅相感目前,金融领域应用主要集中在保险售前助理、智旄投研助理、招股书生成姐写、智能研报合规审查、留筋客服等方向。除此以外,部分企业深挖需求,带来了新脓的应用场景方向,如大模型保险理赔受理、大模型智能数据治理、个人/企业信用偿货能力审查监控等,大模型在金融领域的商业价值将会逐步释放。除商业价值之外,大模型在金微领域的社会价值也开始显露,某银行将大模型与消费者权益保护审查平台结合,利用大模型对理财产品宣传材料实现自动生成审查意见,推荐优秀相似案例作为参考,辅助审香人员开展审卷,能有效解决基层审查能力不足的问题,银行方审古速度和审查港确性得到大幅提升。大a在金1行需算力)MK多提故.金融行业监管严格,对大模型的箱出结果准确住、安全性、合现性都具有较高要求,且金融机构数据隐私性较强,难以在机构间共享,大模型产品往往需要进行私有化训练及部署,这对于金融机构的算力资源提出新的挑祗同时,金融机构对私有化部署的依赖会引发大模型知识持续学习等问题。在金融领域,有三条发展建议。一U±完的JMM1.则呻,制定明确的政策框架和监管指导原则,他保大模型技术在金融领域的应用,既促进创新,又保障金融系统的稳定性和安全性。设立监管沙箱,允许金融机构在一定条件下测试大模型技术的应用,通过实蹑探索合理的监管框架,为未来的监管政策提供依据。二是鼓金机构克大atm当前,金融机构已经逐步开展数字化,具符独立的信息数据平台,应持陵提升金融机构在大模型应用方向的数字化基础,依托自身数据平台,构建安全高质金融数据集,保证数嘉准确有效,数据来源可追溯,生成内容专业、权威。同时,鼓励金融机构加大在人工智能算力上的投入.引入平台级安全算力底座,为技术企业快速安全部署大模型应用提供渠道。三是可以会试在对公务中掾索大MU用.当前大模型在金融领域的应用主要集中在对私业务,可以尝试向对公业务探索。例如将大模型与企业信货业务迸行结合,利用A1.Agent技术将大模型、OCR.RPA等技术及组件进行调用.打造信贷助手,协助信贷经理完成资料收集、风险分析等工作。.产业升级领域产*升锻大-Wfi用推广具松射效皮.一方面,产业领域内上下游企业在结构属性和价值属性上关系密切,一旦领军企业打通了大模型在行业内的应用路径,将会直接驱动行业上下游企业利用大模型进行数字化转型和生产效率优化。另一方面,大模型鼠能产品大规模进入市场,将会更新社会群体对大模型应用的直观认知,从而带动其他领域对大模