互联网电商:大模型加速迭代聚焦AI应用落地正式版.docx
-
资源ID:1170014
资源大小:290.10KB
全文页数:11页
- 资源格式: DOCX
下载积分:5金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
互联网电商:大模型加速迭代聚焦AI应用落地正式版.docx
行业报告一行业专题研究6L国联证券互联网电商大模型加速迭代,聚焦Al应用落地简述行业变化:基础大模型持埃升级演进,多模态成行业趋势。近期国内外Al基础大模型持续升级迭代,阿里、百度、微软、谷歌等头部大厂纷纷升级其基磔大模型,在多模态、长文本、逻辑思维等方面能力均显著提升,我们认为各厂商大模型能力持续升级,有望加速应用落地。底层架构的创新或引发新一轮变革。近期CMU和普林斯顿大学的研究者发布了全新Mamba架构,可以克服Transformer的致命缺陷:核心注意力层无法扩展到长期上下文。我们认为,底层架构的创新有望推动新一轮技术变革,提升Al应用落地效果。AAl应用逐步落地并商业化随着Al基础的大模型的升级和优化,大量Al应用快速涌现,且已有较多应用进行了商业化。海外很多C端应用已经实现盈利,商业模式以订阅为主,应用更偏向于情感陪伴、Al绘画等泛娱乐应用。国内B端应用如智能客服、办公助理等也在快速落地应用,但C端现象级应用短抉。我们认为短期内Al应用主要在对准确性、专业性要求不高的场景,长期则有望向对准确性、专业性等要求更高的领域延伸,如教育、金融、医疗等场景。AAl视频生成领域逐渐突破Al视频生成是多模态领域最大的难题,因为融合了文本、图像、音频等多种媒介,因此在Al生成方面难度最大,当前Al视频生成技术仍处于早期阶段。但近期Al视频生成领域逐渐迎来突破,Runway的Gen-2、Pika、字节的MagicAnimate、阿里的AnimateAnyone等产品表现亮眼,生成视频的流畅度、清晰度等均有较大升级。我们认为Al视频生成能力的提升,可广泛应用于电商、直播、影视等场景,助力相关公司降本增效。AlAgent有望加速应用落地AlAgent是具备环境感知、自主决策并执行的智能体,可以自主思考和调用工具从而完成既定任务,可以克服当前基础大模型存在的内容生成不准确、幻觉等问题,可以将用户从日常任务和重复劳动中解放出来,有望帮助处理几乎所有活动和生活各个领域的事务,对软件业和整个社会都将产生深远影响。“投资建议我们认为随着基础大模型的持续升级优化以及AlAgent技术的快速成熟,Al应用有望规模落地,建议关注营销、游戏、教育等Al应用可快速落地的领域,具体标的上建议关注在Al应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。风险提示:技术发展不及预期风险;竞争加剧风险;Al安全、隐私风险等。证券研究报告2023年12月08日投资建议:强于大市(维持)上次珑议:强于大市相对大盘走势作者分析师:陈梦瑶执业证书编号:S0590521040005邮箱:CmygI联系人:周砺灵邮箱:zhouIl相关报告1、互联网电两:谷歌Gemini正式发布,多项能力行业领先2023.12.07NM MBA .用其q*>ywu. ATMZMQR上Mn ½ 会2 Hl>M.JU . M.m <«.1 JLCAJOn t ii1 .基础大模型持续升级演进头部科技大厂引领行业发展,多模态成行业趋势。由于Al大模型依赖庞大的算力资源、优秀的Al人才、丰富的数据等条件,海外逐渐形成了以微软/OPenAI、谷歌、Meta、AWS等科技巨头为代表的竞争格局。国内大模型厂商除了阿里、百度、华为、腾讯等头部大厂,科大讯飞、360、Minimax等一众厂商纷纷入局,竞争激烈。技术方面,大模型技术不断从文字、代码延伸至音频甚至视频领域,多模态成为主流大模型的典型特征。与OpenAI深度合作的微软行业领先,正在将OpenAI最新大模型GPT-4Turbo集成到自身产品中,在多模态、长文档、知识库等方面全新升级,持续引领行业。北美时间12月6日,谷歌正式发布全新原生多模态大模型Gemini1.0,在推理、编程等多个方面行业领先。谷歌将在其相关产品中全面集成Gemini的能力,包括搜索、广告、Chrome、DuetAl等。Meta则押注开源大模型,LLaMA2已成为最优秀的开源模型之一,并衍生出过个应用和项目,但仍与OpenAL谷歌PaLM2大模型有差距。10月17日,百度发布文心一言4.0,理解、生成、逻辑、记忆四大能力都有显著提升。10月31日,阿里通义千问2.0发布,阅读理解、逻辑思维以及数据处理等方面的能力都有了显著的提升。我们认为各个厂商大模型能力持续升级迭代,有望加速应用快速落地。图表1:典型Al大模型进展梳理maifct<,A个憎c.资料来源:财联社、智东西、界面新闻、36起、金融界、机器之心Pro,澎湃新闻、界面新闻、新智元、华尔街见闻,国联证券研究所整理底层架构的创新或引发新一轮变革。TranSfOrmer是目前Al大模型的主流架构,但TranSfOrmer存在致命缺陷:TranSfOrmer模型中自注意力机制的计算量会随着上下文长度的增加呈平方级增长,导致核心注意力层无法扩展到长期上下文。近期CMU和普林斯顿的研究者发布了新的SSM架构Mamba,这种架构在语言建模上与Transformer能力相当,而且还能够线性扩展,同时具有5倍的推理吞吐量,在语言、音频、DNA序列模态上都实现SOTAo我们认为,底层架构的缺陷直接影响大模型的效果和性能,底层架构的创新有望推动新一轮技术变革,加速Al应用落地。图表2:Mamba与Transformer吞吐量对比( / Suez) -ndc6noqA1248U 32 M 12Batch size46Trnfor¼r 1 38Mamtoa 6.9Tnn*formr 6 7BInference throughput on A100 80GB (prompt length 2048)资料来源:Mamba:Linear-TimeSequenceModelingwithSeIectiveStateSpaces,国联证券研究所2 .应用落地多点开花2.1 Al应用逐步落地并商业化随着基础大模型的持续升级和优化,大量应用快速涌现,其中海外应用起步较早,已经有比较多的Al应用进行了商业化落地。根据美国风险投资公司A16z提供的TOP50的Al产品榜单,海外很多C端应用已经实现盈利,商业模式以订阅为主,应用类型则更多偏向于情感陪伴、Al绘画等泛娱乐应用,如C端情感陪伴类应用Character.AlAl绘画应用Leonardo,ai0国内Al应用虽然起步较晚,但Al相关应用快速涌现,尤其是B端应用如智能客服、办公助理等,C端应用相对较少,类似妙鸭相机这样的应用短缺。我们认为,在Al应用落地早期以对话机器人Chatbot和简单的工具应用为主,主要在创意设计、聊天互动等对准确性、专业性要求不高的场景,长期则有望向对准确性、专业性等要求更高的领域延伸,如教育、金融、医疗等场景。图表3:Al应用落地节奏复余任善:件 等Ir 影制段计 办公松件电育务眠疗It A国单任务资料枭源:澎湃新闻,36 &.国联证券研究所整理2.2视频生成领域逐渐突破Al视频生成是多模态领域最大难题。与文字、图片相比,视频是融合了文本、 图像、音频等多种媒介的综合体,在表达、画面丰富性等方面具有较大优势。也正是 因为视频内容的复杂性,导致在Al生成领域视频内容生成成为一大难题,目前文生 视频技术仍处于早期阶段。这与视频生成工具的底层原理类似,目前主流的文生视频 主要包括犷散模型、生成对抗网络GAN以及Transformer模型,但扩散模型采样速 度较慢,GAN存在训练不稳定的问题,TranSfOrmer模型质量高但计算成本大。同时 在数据方面也面临较多问题,文生视频缺乏高质量数据集,且视频生成需平衡空间与 时间信息,模型迭代方向集中在提高生成质量与连贯性。routsOutputCuts rt ryDiffusionimagePredicted noisej*J-因丁 rj切Ei3图表4:Al视频生成三大方案GNTranSfornWr资料来源:StableDiffusion.36ThallesSilva,国嵌证券研究所Al视频生成逐渐突破,应用前景广阔。近期Al视频生成领域国内外进展迅速,Gen-2、PikaI.0、字节MagicAnimate、阿里AnimateAnyone等产品均有亮眼表现。11月3日,Runway视频生成工具Gen-2迎来重磅更新,在文生视频和图生视频中为结果的保真度和一致性带来重大改进,克服了早期版本生成视频内容不连贯、闪烁变形以及低清等问题,视频效果甚至达到4K超逼真的高度。11月29日,成立仅半年的Al初创公司Pika正式推出Al视频生成工具Pika1.0,支持从普通2D动画到实拍感的电影场景、3D动画的生成,还能够支持对视频实时编辑和修改,其中生成的视频在光影、动作流畅度等方面甚至都不输好莱坞动画电影级别。近期阿里和字节也推出了自己的Al视频生成工具,阿里推出了AnimateAnyone,只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。字节则联合新加坡国立大学推出了MagicAnimate,同样是利用Al技术,将静态图像变成动态视频。我们认为,随看Al视频生成技术的不断优化,其应用前景广阔,可广泛应用于影视、游戏、电商等场景,助力相关公司降本增效。AliilmIQC AjIyuIIcPilui LU资料来琼:新智元、36且、量子便、Arxiv.org.国联证券研究所2.3AlAgent有望加速应用落地AlAgent是具备环境感知、自主决策并执行的智能体,可以自主思考和工具调用从而完成既定目标。我们认为,在基座大模型能力不断优化完善的背景下,AlAgent有望成为应用落地的主要路线之一。因为大模型基于Prompt进行被动交互,而且Prompt的质量会直接影响大模型的回答效果,大语言模型应用落地仍面临诸多挑战,尤其是基础大模型仍不完善,存在生成内容不准确、存在幻觉等问题。而AlAgent可以基于目标任务主动思考并行动,还能调用外部工具,可释放LLM的应用潜能。AlAgent可以帮助用户从日常任务和重复劳动中解放出来,从而缓解人类工作压力并提高任务解决效率,同时智能体可以独立地分析、计划和解决问题,不再需要用户提供明确的指令:在解放用户双手之后,智能体还解放了他们的思维,使他们能够从事探索性和创新性的工作,在前沿科学领域充分发挥他们的潜力。总之,Agent有望帮助处理几乎所有活动和生活各个领域的事务,对软件业和整个社会都将产生深远的影响。图表6:AlAgent工作原理资料来源:B.国联证券研究所AlAgent浪潮将至。AlAgent是近期社会关注和热议的方向,国内外厂商纷纷布局。阿里云推出模型调用工具魔搭GPT(ModeIScopeGPT),用户可以通过一键发送指令调用Mota社区中其他人工智能模型,从而实现模型的协作,完成复杂的任务:昆仑万维正式发布“天工SkyAgentsv平台,用户可以通过自然语言和简单操作,无需代码编程,即可在几分钟之内部署属于自己的AlAgents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等需求。海外在Agent方面研究进展更快,AutoGPT是GPT-4完全自主运行的首批示例之一,突破了人工智能所做的边界,他结合了GPT-4和GPT-3.5技术,通过API创建完整的项目:BabyAgent是一个人工智能驱动的任务管理系统,能够根据先前任务的结果自主解决任务并保持预定义的目标,还能有效地确定任务的优先级。Plwinlnc,CleIetB”;KitchnfMiurUwrDiscussing decorationAn Cnvitioned Agtnt Society*nd <*orirtgICHAg >Hf6 too(,,a WsHnf ad o“IE 04erint dKMs nd C0¢in资料来 i: The Rise and Potent i a I of Large Language Model Based Agents : A Survey3 .速议标的我们认为随着基础大模型的持续升级优化以及AlAgent技术的快速成熟,Al应用有望规模落地,建议关注营销、游戏、教育等Al应用可快速落地的领域,具体标的上建议关注在Al应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。4 .风险提示技术发展不及预期风险:Al大模型相关技术仍不完善,底层TranSfOnTler存在架构块陷,使得大模型存在回答不准确、易产生幻觉等问题,技术升级迭代可能较慢,影响相关应用规模落地。竞争加剧风险:行业参与者众多,除了头部大厂还有众多中小企业以及创业公司,导致行业竞争激烈。Al安全、隐私风险:Al生成内容可能存在暴力、政治敏感、低俗等问题,同时Al发展可能导致大量数据收集和分析,可能包含个人隐私信息,会对个人隐私造成较大隐患。分析师声明本报告署名分析弹在此声明:我们具有中国证券业协会授予的证券投资咨询执史资格或相当的专业胜任能力.本报告所表述的所有观点均准确地反映了我们对标的证券和发行人的个人看法。我们所得报酬的任何部分不瞥与,不与,也将不会与本报告中的具体投资建议式,观点有直接或间接联系.评级说明投资建议的评级标准评级说明报告中投资建议所涉及的评级分为股票评级和行业评限(另有说明的除外)评级标准为报告发布日后6到12个月内的相对市场表现,也即:以报告发布日后的6到12个月内的公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。其中:A股市场以/深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;杳港市场以摩根士丹利中国指数为反准;美国市场以纳斯达克母含指敷或标普500指数为基准:舛国市场以柯斯达克指数或林国综合股价指数为基麻。股票评级买入相对"同期相关证券市场代表指数涨幅20%以上增持相对同期相关证毋市场代表指数涨幅介于5广20%之间持有相对同期相关证券市场代表指数涨幅介于T0%5%之间卖出相对同期相关证券市场代表相敷茨幅10%以上行业评级强于大市相对同期相关证券市场代表指数深幅10%以上中性相对同期相关证券市场代表指数涨幅介于T0%10%之间弱于大市相对同期相关证毋市场代表指数跌幅10%以上一徽声明除非另有规定,本报告中的所有材料版权均属国联证券股份有限公司(已获中国江监会许可的证券投资咨询业务资格)及其陆属机构(以下统称“国联证券”)。未经国联证券事先书面授权,不得以任何方式修改、发送或1者复制本报告及其所包含的材料、内容。所有本报告中使用的商标、服务标识及标记均为国联证界的商标、服务标识及标记。本报告是机密的,仅供我们的客户使用,国联证券不因收件人收到本报告而视其为国联证券的客户。本报告中的信息均来源于我们认为可靠的已公开资料,但国联证券对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供客户参考,不构成所述证券买奔的出价或,征价遂请我要约。该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。客户应当对本报告中的信息和意见进行独立评估,弁应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收寻方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,国联证券及/荻其关联人员均不承担任何法律贵任.本报告所戴的意见、评估及预测仅为本报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。过往的表现亦不应作为日后表现的预示和担保。在不同时期,国联证券可能,会发出与本报告所栽意足、评估及预测不一致的研究报告。国联证券的销售人随、交易人员以及其他专业人士可葩会依据不同假设和标维、采用不同的分析方法而口头或,书面发褰与本报告意见及建议不一致的市场评论和/或,交.易观点。国联证券没有将此意见及电议向报告所有接收者进行更新的义务。国联证券的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或珑议不一致的投资决策。特别声明在法律许可的情况下,国联证券可能会持有本报告中提及公司所发行的逐季并迸行交易,也可能为这些公司提供或争取提供投资报行、财务预问和金融产品等各种金融服务.因此,投资者应当考虑到国联证券及其相关人员可能存在彩响本报告观点客观性的潜在利曲冲突,投资者请勿将本报告视为投资或其他决定的唯一参考依据。版权声明未经国及证券事先书面许可.任何机构或个人不得以任何彩式翻版、复制、转萩、刊免和引用。否则由此造成的一切不艮后果及法律货任有私自翻版、«.制、转载、刊究和引用者承杷。联系我1北京:北京市东城区安定门外大街208号中粮犬地广场A塔4楼上海:上海市浦东新区世纪大道1198号世圮汇二座25楼无修:江苏省无锡市金融一街8号国联金融大厦12楼深及:广东省深圳市福田区益田路6009号新世界中心大厦45楼电话:0510-85187583