人工智能应用专题(4):国内AI大模型趋势探讨互联网大厂AI进程梳理正式版.docx
《人工智能应用专题(4):国内AI大模型趋势探讨互联网大厂AI进程梳理正式版.docx》由会员分享,可在线阅读,更多相关《人工智能应用专题(4):国内AI大模型趋势探讨互联网大厂AI进程梳理正式版.docx(77页珍藏版)》请在课桌文档上搜索。
1、里拿辿惠智券研究报告I2024年01月02人工智能应用专题(4):国内Al大模型趋势探讨,互联网大厂Al进程梳理行业研究行业专题投资评级:超配(维持评级)联系人:王颖婕0755-81983057wangy i ngj i e1 uosen. com. cn联系人:陈淑媛021-60375431chenshuyuan证券分析师:张伦可0755-81982651zhanglunkeS0980521120004联系人:刘子谭Iiuzitan摘要 大模型技术本质上来源于科研创新与技术积累,我国大模型厂商根据自身特点演绎出不同的发展方向。大模型诞生与技术的积累与不断创新,伴随海外技术进步与大模型开源,我
2、国大模型企业也在不断追赶,包括根据其技术路径自研或在其开源框架上优化调整。 有效数据集有限,优质数据集仍旧稀缺,关注具备高质置内容的平台。大模型的未来发展依赖于训练数据集的质量,而非仅仅是数量。Al技术把原先难以利用的非结构数据带入分析领域,内容创作者所聚集的平台成为高质量数据的重要来源。 大模型后续竞争格局B端与C端分化:C端更易于产生通用底座以及大一统的入口,通过丰富的插件、定制化功能、AlAgent满足用户的高度定制化和长尾需求。B端定制化模型或垂类模型性价比更高,不同B端行业可能用各自模型来满足企业场景、业务流程、模型大小和性能的差异化需求。 AlAgent框架带来全链路、定制化的信息
3、处理能力,成为生产环节的重要辅助,助力智能硬件ltAIIinOne”抢占终端流置入口。AIAgent需要标准定义和模型能力进化,同时GeneratiVeUl可能带来人机交互方式的革新。月之暗面、清华GL*百川智能:作为独立的第三方模型厂商,创始人技术背景强,模型迭代速度快,产品布局AlGC等各个领域。 互联网大厂腾讯、字节、百度、阿里:结合自身业务场景进行模型和Al应用的开发,同时布局算力、平台、大模型与应用全环节,关注Al生态建设。投资建议:国内模型能力有望快速提升,带动应用百花齐放。建议积极布局大模型相关厂商和产业链机会。风险提示:宏观经济波动风险,下游需求不及预期风险,AI伦理风险,核心
4、技术水平升级不及预期的风险等。请务必阅读正文之后的免责声明及其项下所有内容目录01大模型的竞争格局演绎的关键因素02独立的模型团队一月之暗面、清华GLM、百川智能03互联网大厂的模型和应用进展一腾讯、字节、百度、阿里04风险提TF请务必阅读正文之后的免责声明及其项下所有内容大模型技术本质上来源于科研创新与技术积累伞更侯蛙烹 海外大厂核心大模型的能力迁移是国内Al发展的重要考。考察是否有海外大厂核心大模型研发的技术积累和知识迁移到国内,以及这些技术在本土的应用情况和调整,对理解国内外Al技术的差异和互动具有重要意义。 国内企业大模型技术路线有两类:自研效果复现类:参考GPT论文自研复现效果,前期
5、耗时、后续FinetUning对于数据数量质量也有一定要求,能力天花板高;基于开源迭代类:训练更顺畅但天花板低,依赖开源社区,且开源模型如Uanla2比较GPT3.5还是有差距。 国内企业大模型团队发展路径有两类:从搜广推背景转向大模型研发,如百度和百川;成立之初主要基于大模型研究路线和学术背景,如月之暗面的杨植麟团队和清华的智谱团队。:不同公司/组织/院校近三年top-100 Al发文 WM MnTeam-Baidu11Huawei Noah,s ArkLabNEZHA- Plus86.712Alibaba PAI&ICBUPAI Albert86.114TencentJarvis LabR
6、pBERTa( nsemble)85915Zhuiyi TechnologyRpBERTa- mtl-adv85.7Tsinghua GLMGLM 515M78.8图2:海外沙卧IUe模型号里排名(截至2吟3.于12月) 资料来源:蟾i CaSte 11 a苔 %p6,资料来源:Du4YQian等,GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling,ComputationandLanguage(cs.CL),42022,arXiv:2103.10360,国信证券经济研究所整理基于开源大模型框架进行优化调整、应用
7、创新较易落地伞里!!明烹OpenAI的核心能力主要体现在三个方面:1)数据收集和处理的能力,包括数据来源,清洗方式,数据结构等;2)模型结构,包括注意力、隐藏层等设计;3)训练方法,包括各类超参数,学习率等。海外大模型开源后,我国大模型企业可在其框架上进行优化调整,以百川智能为例:基于开源模型提升性能:据GitHUb,百川智能通过对LLaMA框架进行修改以提升训练时的吞吐。此外,在LLaMA较为薄弱的中文语料方面,百川智能采用2000万条以中英为主的多语言语料训练分词模型,显著提高中文的压缩率。A大模型+搜索增强解决方案服务B端场景:百川智能通过借助搜索增强,解决大模型在幻觉和时效性问题,提升
8、了模型的可用性,并拓展了应用领域,如金融、政务、司法、教育等行业的智能客服、知识问答、合规风控、营销顾问等。图3:Baichuan-7B对LLaMA框架进行优化后的性能提升图4:在LLaMA上进行的研究工作的演化图资料来源:Wayne Xin Zhaov Kun ZhoU 等,A Survey of Large Language Models,I信证券经济研究所整!Computation and Language, 2023, arXiv:2303.18223.ModdBAkhuanJBIUMAFikonmpV7BChMGLMmossmoon-003Compress Rate0.7371312
9、104912060.6310.659VbcabSize64,0003Z00065,024502S4130r344106,029资料来源:GitHub BaiChUan主页,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容高质量训练数据促进大模型技术的提升,但优质数据集稀缺伞里!姓烹有效数据集有限,优质数据集仍旧稀缺。当前开源榜单公开训练数量级,现有常见的大模型训练数据集往往在几十到几百B的量级,优质的数据集可能就只有300-5OOBtoken,进化到多模态数据量有所增加,但总量也不多。有的模型会用万亿级别的数据token训练,但很多数据其实是无效的。大模型的未来发展依赖于训练
10、数据集的质,而非仅仅是数量。根据ScalingLaw,Transformer架构的语言模型性能在很大程度上取决于模型大小、数据集大小和训练计算量,性能与这三个因素之间存在累律关系,且趋势跨越多个数量级,而对其他架构细节(如网络深度或宽度)的依赖相对较小。未来的大模型可能会经历增长飞轮效应,但关键在于训练数据集的质量。这强调了选择和使用高质量数据的重性,而不仅仅是追求数量。单纯的用户数据上不一定会产生飞轮效应,比如某些用户数据目前只具备统计学的能力,能够发现逻辑、数学的问题还需要找逻辑、数学数据集去优化。图5:各大模型训练数据集对比图6:ScalingLaW模型性能与模型参数、数据集和训练计算量
11、成幕律关系UdlB)IXZAgMhUPI-J (IT5BMTiLG JOBlvhm BVcMl3U MCH Swm*A12K 2ItW rc MkdW*r 4I, WoI BU.3(HSl (AHb MIk IVKlnrift ROIG J(n BCt A!t*fl7*U X)ln BRI l Hf W2N.加明 WtfWr ArXn (7. 2S(L 4 % M MvMfd AbtactiOKi. XX”-. 30ft t Nt - M 0OMM资料来源:OpenAI官网,国信证券经济研究所整理资料来源:WayneXinZhao%KUnZhoU等,ASurveyofLargeLanguage
12、Models,ComputationandLanguage,2023,arXiv:2303.18223,国信证券经济研究所整理Al技术将更大范围的数据带入分析领域,关注稀缺内容平台伞三B三Al技术把原先难以利用的非结构数据(占比80%)带入分析领域。Al浪潮下数据资产的重要性凸显,SnoWflake在财报会提到Al技术把原来客户无法利用的非结构化数据带入分析领域构成新的增量。一系列数据公司与产品受益,包括云数据仓库领域(SnowfIake)、非结构化/向量数据库(MangoDBxPinecone)、云数据监控(DataDog)和ML/AIOps领域(DatabricksxAWSBedrockx
13、Weights&Biases)o内容创作者所聚集的平台,如字节和腾讯视频号成为高质量数据的重要来源。随着内容创作者转向音视频平台,这些平台成为了聚集高质量数据的热点,如字节跳动和腾讯视频号等平台。部分观点类数据可能具有一定时效性,如百度问答和知乎等平台上的数据。图7:各大模型训练数据集对比图8:AI技术下数据分析各领域的增量公司模型敷数据规模阿里巴巴M610T1.9丁8图像和29268文本智源研究院悟道2.01.75T4.9T腾讯混元1T2T百度文心260B45TB中科院自动化所紫东太初100B1.42TB中文智谱华章ChatGLM31.5B、3B 和 6B百川智能百川2B/7B/13B2.6
14、T上海人工智能实验 室缶生7B/20B2.3T (lnternLM-20B)科大讯飞星火170B数十亿的语言数据集商汤科技InternLM1,04B16 万亿 token春田知韵(抖音)豆包7B1300fZ,阿里云通义千问7B3 万亿 tokens华为盘古200B40TB中文文本、3B图像资料来源:各公司官网、国信证券经济研究所整理资料来源:KarIKeirStead等,AlSurveyofEnterpriseExecs-ShapingtheAlNarrativeInto2024,U.S.Software,2023,国信证券经济研究所整理责声明及其项下所有内容大模型的竞争格局猜想一C端集中,B
15、端差异化竞争 C端:通用的大模型技术底座不会太多,可能只会有一个大一统的入口,通过丰富的插件、定制化功能、AlAgent满足用户的高度定制化和长尾需求。从大模型的迭代发展,我们看到底层技术基于TranSfOrmer架构的统一化。随着模型能力的增强,与硬件终端协同可能加剧流量入口的集成和统一。 B端:不同行业具有各自垂类模型,不同大小的模型适用于不同场景。由于企业场景、业务流程差异化,不同的领域模型功能、数据集、模型大小和性能都有较大差别,定制化模型厂商或小模型性价比更高。目前出现很多竞争厂商在B端发力,比如Cohere、或者在Huggingface上用开源模型改造。图9:近年来现有(大于IOB
16、)大语言模型的时间轴图10:北美各大企业的Al应用行业分布l*ttNkl aihMrWrbrGI.M GMl、LG KctKl )0MGLM4f 做SG r4 NI to./C U 0、-W V L*LSAS b2资料来源:Wayne Xin Zhao、Kun ZhOU 等,A Survey of Large Language Models, Computation and Language, 2023, arXiv:2303. 18223,国信证券经济研究所整理资料来源:Kar I KeirStead 等,Al Survey of Enterprise Execs - Shaping the
17、 Al NarrativeIRlI请务必阅读正文之后的免责声明及其项下所有丙容OPenAl商业模式:大模型技术领先,积极尝试构建生态壁垒三三S三通过先进的闭源实现商业化,通过开源前代模型构建生态:OPenAl的GPT技术路线是当前模型自研商家优先选择并跟随的技术方向,而OPenAl凭借大模型的领先优势,后续更新到GPT5后,有可能将前代GPT3.5开源,通过更新一代、开源一代来实现自身战略。领先模型闭源、服务B端客户实现商业化,落后模型开源繁荣GPT生态与应用建设。通过AlAgent的形态去构建流入口:OPenAl在AlAgent与流量入口领域有许多尝试,比如插件生态、GPTsoGPTS出现打
18、破过去的软件孤岛、复杂、不能满足长尾需求的缺点,创建过程工具化标准化而且创建成果产品化。但是AlAgent必须要对个人有全链路的信息处理能力,当前GPTS实际上对个人信息的创建和积累是分裂的,比如单人创建不同的GPTs,其实它们之间互不相连,导致可能会产生训练和数据的浪费。图11:OPenAI模型演进图图12:OpenAIGPTS应用资料来源:0PenAl官网,参考文献:WayneXinZha0、KUnZhOU等,ASurveyofLarge资料来源:GPtShUnter官网,国信证券经济研究所整理1.anguageModels,ComputationandLanguage,20231arXi
19、v:2303.18223,国信证券经济研究所AlAgent:成为生产环节的定制化辅助,带来人机交互的革新伞里假照! AlAgent框架为大模型提供结构化思考方法,成为生产环节的重要辅助:大模型作为理解推理能力不断增强,软件生产进入低门槛、高定制化时代,面向用户的长尾、个性化需求,Agent框架可以打造每个知识工作者的Al助理。 AIAgent需要标准定义和模型能力进化,同时GenerativeUl可能带来人机交互方式的革新:当前大模型对连续的复杂推理问题包括对多模态信息的交叉处理仍有不足,需要用更复杂、结构化、多维度的数据来进一步学习。另一方面,Agent应用对当前的人机交互方式带来改变,演进
20、成为同时适用于人类和Al操作的形式。 案例:Agent以类人的方式与智能手机应用进行交互,使用点击和滑动等底层操作来操作图形用户界面(GUI)。利用大型语言模型的视觉能力以类似人类的方式操作智能手机应用程序。在探索阶段,智能体与智能手机应用程序交互并从结果中学习,以创建一个全面的参考文档。在部署阶段,智能体利用这个文档汇编的信息来有效操作和导航应用程序。图14:多模态智能体框架在智能手机APP操作中的多种应用图13:用于操作智能手机应用程序的多模态智能体框架概述资料来源:Chi Zhang, Zhao Yang 等,AppAgent: Multimodal Agents as Smartpho
21、ne Users, Computer Vision and Pattern Recognition(cs. CV), 2023, arXiv:2312. 13771,国信证券经济研 究所整理资料来源:ChiZhang,ZhaoYang等,AppAgent:MultimodaIAgentsasSmartphoneUsers,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,国信证券经济研究所整理1o有内智能硬件AllinOne终端流量入口的抢占之路AIGC将带来无限的内容生产与供给,进而颠覆当前的信息分发方式:a16
22、z曾说过“芯片将计算的边际成本降到了零,互联网将分发的边际成本降到了零,现在AIGC实际上将创作的边际成本降到零”。每个人都有机会获得无限的娱乐内容供给,互联网常见的信息分发方式未来可能都面临重组。人会从主动生产和管理信息,进化到与Al共同生产以及与Al辅助管控共存。智能终端充当人类和Al认知世界的延伸,依托大模型同时满足生产力、社交娱乐等全面需求。相比软件产品智能硬件终端更容易演化SJaIIinone的形态,从而抢占终端的流量入口。从苹果生态来看,智能终端的壁垒同时取决于生态业务场景的广度和深度,而Al大模型的技术同时带来两个维度的革新。图15:苹果MR眼镜图16:谷歌PiXelAl手机图1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 应用 专题 国内 AI 模型 趋势 探讨 互联网 进程 梳理 正式版
链接地址:https://www.desk33.com/p-1170569.html