腾讯云教育行业大模型产品方案手册.docx
国内大模型百花齐放,产业落地已过尝鲜期"O台多内生威天对诺文室解林产业落地实效成大模型价值重要评估维度金融客户服务风险管理分析决策政务澹程管理决策支持社会保障C3壁广8«RVB脉行Cue的枕程峥«««»文才评文字3利Tlk研发设计生产制造管理服务传媒媒资管理内容生产媒体传播交通智能调度运行监测模拟预测畿源自动监测报警诊断运维管理国内AI政策大爆发2023年,多地市发布人工智能相关政策&mM89IIAira美TiermXMrMUUaM千WMH>E223B,ItteWMuBltAIeWIt悌mt!(20232025)sm$B关于302廊展"4HWy创IAIgrtXmt设IWI全!t"gX5MMlSASOBMKKBY(ZO23iOZS)>.-MmAtt*XM9e-HM)4f110CoM入产M三:KMi的11Jn(2oa-初W)>Ml诩IB仁3Waa4*1.«/7«(3-2041t)>HACiCQ(三5<5t-1MAIWWktM三M三a9三÷三("见)>MWlMeCHMXRtEoeMnttetlI(2023-20»)>7R3B(奸.xmg工作©mam代沈产北体多(IMS>BJIlma(加修元*tmmt(»21-202»)(拉京见>)JJ97MB(14mAIVttt9MF三MW÷a)*M7UB设Hflt设三年行动(迎102Se)ft7月24日7月27日,皮用以*Mlm产&MfltMn词W(2O21-2O2S<)>(航川百人MRDl打关于W法人Er.*Mxwmssi)8A16B(Xf'WSMBXBiwmi产SRtt见)三ABB5/30,北京市政府发布北京市加快建设具有全球影响力的人工智能创新策源地实施方案(20232025年)、北京市促迸通用人工智能创新发展的若干措施3.国产人工甘跣片和深度学习亚架号叫软蝴产且中照占W挺开,算力芯片等曷本实现白壬可控.W硬杵比例空部Eir全面,容国产亲度学习植基.人工智好W力雷暴打网立.心产W处HOOO亿元,阳2%】OKUUJt长,中射产业堞*微H万包后5/31,深圳正式印发深圳市加快推动人工智能高质量发展高水平应用行动方案(20232024年)电却叫市AI欣OBfflfOAJ谓I班,支用鸟校、企业朋例两大蛆等簌:钮属人才重合培弁,彩磁极100O亿元的人工行盆基金屏.皿大收空企11第洽生杰伙件加Q嘤鱼族件及相关物骤Tt研发;履R企业布发基于河际生我大*景的朗斯产晶.6/5,成都市公布成都市关于进一步促进人工智能产业高质量发展的若干政策措施(征求意见稿)支持企业.移明机构刑联0算法与W;珊发,布罔大观横语义帙里、行业赃等.对取博国科技亶大彳项I含科技创新加30大顼目八H京研发计如R项目g或田京科学技术奖状却淳在着港谓化的.蛤¥1MUoOO万元鱼裁文衿.6/14,无锡发布全无锡市人工智能产业创新发展三年行动计划(2023.2025)到202弹,人工智能松心产让烟模达即00(3元,希动根关产立期期OOO亿元.以田胆味BHgWift.生人工右然为壬攻方向,彼快人工智松关健技秘化应用,目标用RW认定5>>0以上人工智能总合色#产品应用麻次方*.HS10(XNJ三M.可报广用典驯m应用场.7/12,福建省人民政府办公厅印发福建省新型基础设施建设三年行动计划(2023-2025年)济化通温人工除军强化甘绫UX.*诩S*t深度学习.Al*?*蹴JS法等人工解关援环方攻关.田蝴i农业,公道运船.帔贡医疗等圣域打造阳绡融合适麦问福州MraSR人工Me创斫应用先res.5c三wshswm.三W2弹,*收款丙述生区.】CCffM或*w为校Jfl试点南.7/24,重庆市印发奥床市以场人工智能产业高质At发展行动计划(20232025年)通声】0轲*U1.t人工智1怆龙头企业.侯总18家人工黄规俎梯以上企业.中成35个人工智柄WM<0BttW三W.髭头企业枳嘤争取“与大佛UmIKlO目,球Al大跄、AJ开发框柒及工具体系等方向,建&AI智能开潴社8.8/13,宁夏回族自治区人公厅印发促迸人工智能创新发展政策措施掖动以医产化CPU.GPU等硬件.力平台和大横省的自主册发,对于事tUB三l百匕.臾巴底用知IUfi过2的大侬,根据柏欢发蚣予不抵Hlfi自总的双投入耽*4180万元资金交的.GTIG产品概述教育行业大模型,助力教学、科研和管理服务生产效能和体验升级学生皮长管理人员户用教再教学管理服务科册创新娃培IPCI手机I菖年学习I一平板I菖一台灯口场景教育行Ik大模型郭力SAI能力口城第习助学AIforEducation51米签成J口('I,!»演Jj三WTMHIGEI文“务I三AIforService段务切字学工明学iHASM后西露AIforScienceKHSXMVI交通行大横更一SIti行业大*RW杼攵Ka里腾讯云TI平台(模型啊建平台)知识引3S(应用构建平台)stt支撑屈层故据中心训练工坊模里修理知识繁所和向用知识管理应用配置运营调优混元大模型开源大程量BIil行业大模型高是互裁网焰(RDMA)高性懿鼓东际(再H败菇承)离性At计算(HCC)GTIG应用场景I场景一:AI英语口语助教核心能力主题对话练习模式:围绕特定主行英语对话练习,支?描度调节,僦对话后可自动生成评测报告;口语对话评测模式:可根据学生需求制定相应单词和句子跟读训练,并实时给出用户发音评测结果,辅助学生的我+就蝴副练习.方案场景英语口瑁方案能力多轮对话设定场心语法纲正发an正对话报示评泅报告主电对话练习散据接口对话时长评到分S底层能力讯自研大事日龄口语评测教智人对话任苍主这对话语音输入I场景二:大模型助力教师备课痛点一场景示例教案撰写耗时撰IflSi表明.20%的精力用于砧研效材、了解学.80%的力用于书写敛案.IS师每周工作中54%时倒用于前课教£.汇报材料81马等 教学活动枯燥2023年8月,敕育部发布职业救育专业军收学资源库建设指两*鼓励合理运用视找Q奥、幼奥、虚掇仿H类等资源,传统效案面IS形式牯爆、多媒体素材或失挑战 教学案例老旧事新课改HI景下,:SR业校回专业帙学资源瓯Ii设指南1明确.高KRiSI学资源康悠年更新比例不低于10%,知识更新周S.检学案例更新的时M性襄茨相应攫升 课件复制照搬罡一线教棘课件更新撅率低、效学耦力不足,制作课件Ct等于下It或组合课件.学校的集体借课就相当于分工搜索下tt.到课件内容质低、创新性不足,.一»力”,给定敕材、课时,生成敕宦一键生成敏案南情并及,色,96/9»,1vm"余W>*em<a>e白幡生成课件大纲多Slm素材生成,场景四:科研文献助手面向对象痛点高校/高职院校教育部将离职高校的科研平台、科研管理、科研项目等指标纳入考梭大模叟帮助高校建设科研文献平台,提高科种效率,助力科研成果转化高校科研院所科研文献大模型帮助研究人费提高科研效率、捕捉前沿现点,促进科研转化输*4理检索定位费力文献阅读耗时阅科研动向更新迭代快,NatUre用用8出读机器学习相关文献更新每23月诩一番,国内日均84篇新文政,假设每篇阅读10分钟,至少需要14个小时文献术语晦涩在计Ii机.玄行、;去律茬领域,近7(巡来,19%文献标怂和73%文Itt摘要中至少包含写术语,而IlO万宗写术语中,79%的术语使用厥次少于13欠针对特定学术关键词进行检索可快速收集大文献,但坦期内Bl合全性的专业H景的知识,形成学术观点并标注观点观».需消耗大酗间精力润色翻译费力在Sl标会议.田际期刊发表科研文献,对学术专业惠达、Ieifil*BI诺白产格要求和标淮,对非母语学者带来挑战I场景五:招生咨询助手面向对象一场景示例一高校招生办2023年高考报名故达到1291万,100万.普通本科校均规模16793人,高职校均J三10168人高考志愿埴报高修时段最多8000通电话/天.大模些承接咨询需求,提高咨询响应率,数智人还原校友风采,打造招钮点高校信息化中心效育信息化明蜿将招生就业、效学科研等(8息务成用纳入考IX体系大模型招生咨询助手打造高校侑电化凫点.S升易校侑息化水平.JH固高校长期影响力-准确”多轮对话.澄清寒团'三Mk,-OHffifi.专业国Sl痛点“新稣的皮”一校友'校长、历史名人数智人,韦翘的灵说“一搭1671角色扮演86力的大模型浮数据场景六:大模型+医学科研探索腾讯医学大模型VJdM)heatase独家授权互联网数据个人健康数据电子病历数据医院沉淀数十年的、电子病历信息、影像信息互联网或上诊疗、智慧问答、智能导诊、智能预问诊、随访等数据患者全周蝌康管理产生的数据,包括物联网设备采集数据,强者在院内、院外的健康数抠I巾川IHMlm小川以业务流程为驱动的信息化以知识、模型、算法为驱动的诊疗新范式功能列表功能项能力说明自由对话自由的英语对话练习,根据用户的输入进行无主题英语聊天对话主题对话输入讨论的主题和角色说明,大模型牵引用户围绕特定主题进行英语对话练习,偏离主题则模型拉回主题讨论课文对话练习输入课文等参考内容,根据设定的问答内容进行英语对话对话提示在对话过程中,根据对话历史和最近一句模型的输出内容,提供用户参考回亘建议单句评价从语法正确性和内容合理性等方面对用户的回复进行评价难度的设置与调节按照指定的学段的难度要求设定模型输出的预计难度,并支持在保持相同语义的情况下,增加或者解氐模型输出内容的难度会话评分对于模型与用户完成一段对话后,对于会话过程中用户的语言组织、语法、用词等方面进行分析与评分口语陪练提升模对话流畅度和角色支持教材同步练能力,支持围绕任务的同步练习整体提升情景贴合度、常融入性,对话贴近口语表强化对于教材练习的指能力,提升对话牵引的表识准确性、对话一致性、达令遵循能力现和口语表达表达丰富性难度调节支持按照浮初中高中的支持表达难度的增力M邯串支持小学初中范围内更细语级调整表达难度低粒度的语级难度调整其能力优伸E英文、中英文结支持对话提示、单句的合等负面案例的输入语法和表达纠错支持整段对话的评测打分竞争表现主题练习表现对标讯飞对话提示、纠错和评分能口语陪练各项能力效果力领先表现领先国内大模型核心能力二:教案生成能力展示I核心能力二:教案生成算法迭代规划内容/语言生成格式学段学科通过教案数据训练,指令精调优化模型,教案生成的语言风格对齐人工教案保证内容正确性,提升教学过程的内容多样性和完整性提升核心素养在教案生成保证教案内容准确性、完内容里面的体现,教案的整性、多样性领先润色能力提升内容丰富度提升,补充支支持按照markd。Wn格式支持理科的公式按照增加多模态生成等亮点能持题目生成等细节内容输出,内容结构清晰markdown格瓶!)出力初中语文、历史、地理初中文科、英语初中文科、英语初中主科全学科竞争表现内容丰富度领先教学过程的正确性和丰富度领先整体生成效果表现领先竞品核心能力三:行政知识问答Hfflcx三sw<H网CDCH.tt*11a*.awMC««XH*二t»:EIQn应用配置知识管理测试及发布体蛉GTIG五、产品优势说明I模型优势:腾讯云教育行业大语言模型研发流程腾讯云教育行业大语言模型:全流程数据驱动的模型训练强化学习增强的技育行业对话模型使用客户反愫的问Ii以及戳育专家的It议.针对性送代优化模里致育行业对话模叟收育假学问答,做案生成等近百万条有监督IfilS教育行业预训炼模型中小学及闻5IS材、刊论文、读标的.100B+TokenSlfiiHJUgPretrainModel预训练模型基础预训练模型不同应用场JR下海启质无监管数据集模型能更贴近真实使用场景,回答更加专业模型具爸教育领峨专业能力模型具备完善的效白领域专业知炽体系模型具爸深厚的通炽知识基础模型优势:腾讯云教育行业领域数据沉淀教育行业大模型从模型的预训练、精调和强化学习阶段加入了教育行业的数据,从基础知识到领域知识全方位优化提升模型在教育领域任务表现,数据范围惹盖以下内容无监督数据:教育领域的海量的文本内容 课程标准:义务教育课程标准、普通高中课程标准等 教材:中小学教材、高校教材等 学术文章:学术论文、期刊等有监督精调:教育行业领域数据 教案:小学、初中、高中教案 对话:英文对话,教材的英文对话 题目:初中、高中的各学科题目、编程题目模型优势:从数据构建到模型训练全周期Reinforcement1.earningfromHUmanFeedback(R1.HF)W)A目一preferencedatamaximumesamplecompletionsUkelihoodreinforcementlearning自闫一preferencedataEaXimUmUkelihood1.enothFerIanguapeFilterSemmveHkerExtractedKghyUaIItyTcrt国国国(E)l三)(U(U细粒度、体系化的数据构建流程细粒度无监督数据收集和清洗针对特定任努的数据构建方案labelrewardsX'srewardmodel1.Mpolicy高效的增量预训练策略修改模型结构的增量预训练,冻结基础模型的参数,只训练增量参数final1.MSFT+DPo有监督训练全参数有监督精调基于DPO的强化学习对齐RAG能力优势:基于1.1.M+RAG框架,做深做透全链路能力知识解析知识切分OC瞰析大侬卿+25%通过长文本大模期文本进行多级语义拆分(标起、副标S1.段落等)Q8元素:段落、表格、公式,图标等;但法能力:版Ia分析.元求排序2、结构化表格场景浜焦论文.泉寺、说tti业内首个的长文本切分大模型,比榭充切分方式准确率显著提升4、多列混排文档模型阅读理解&答案生成深入上百个客户的应用场景.亿纵行业数据针对性训炼数字问答操作步骤问答将OCR识别的标题提供给切分模型,进行多级切分,谢免语义欲断.提升冶索及阅读理解准确率0知识检索Embedding模型从512字坦升到J4k,支持多套检索策略债券增强1902理财产品期有了19妖,赎回手续费是多少?”"智能阴匙怎么使用?"表格问答推理比较横理名大长度蠢试集准确军云闯,73.09OpenAI819252.00友育Z51270.54发商AS1272.49友曲VV51263.66r在国fi咯的CMTE8榜单上,模Si在8个中文任务上可以达朝1聚墨优2.使用的关蝮冏附检辎麻衣格文字混自检索S(品等,提升胆在多场景TfflGwjegZJinllWtt“我想在南山西丽街道组每月每平方60元左右的办公场地,有什么推荐""标准版和旗舰版差多少钱?"安全性优势:三重安全防护,保障行业大模型可信、可靠、可用问题防护侧算法防护侧答案防护侧审核模型标ES合规辱纥文本部资文本广告文本涉帚文本不适宜文本审核模型在问物侧、模型恻、答案侧三个层面进行违规信息的过海和规避,让最终的答案符合安全、规范的要求.行业大模型资质入选信通院首批优秀大模型案例牵头国内首个金融行业大模型标准信通院大模型标准核心编写单位中国电子工业标准化技术协会大模型标准核心编写单位沙利文2024年大模型评测腾讯混元能力领先中国大模型均线=15个岬大旭2均分国际大横型均线二Gemini1.0GPT4GPT3.5Claude2竞争悌队国际大模型均线n讯混元专业应用能力中国大膜型均线第三梯队第二梯队第一梯队通用型健力GTIG项目案例Am尸日玲救大HS!修以大事熨拿空M慢凌用费者利用.R外,Co©C介蜴下光a作斯光合作用S!N色倍a.sxraxea在SJ见拗Ie射下.到网光合eu将二事化RIG东川化为寻机爬并H放霰气的震化过臼.WfthyOBMFAghkhHoM>vct.M«*YuJmomMm*i*U4k*rcdfixMHmwiW>¼mc:rnCn*.rmPnnUryfc<w*«<Pro、禅”CdIKetKalCqnMkaeer>cs某出版集团共建中小学智慧教育平台讯云提供知识弓1掌、做智人.助力构建中小学智It教育平台,Ie型脚生.家长知识弓1:面向K12那生,在敢学全流程下,攫供和等对话BB多效智人:BlK12Vi±.在课明备课、读后Iii等场景下,提供等多模态对话服务.”*WM-,M»1,-a*-ra*«*R«I企服场景,结合企业知识库自动生成专业答案辅助坐席项目背景一线客服工单效能低,自助闭环率有待提升-理解客户问题的知识专业性要求高-传统"文档搜索"耗时长,理解成本高产品示例及效果f三xms需从大文档分散知识中总结关地值患MOOA*1长文档自动学习总结,生成答案0产研团队知识运营成本高、更新慢-需要通过人工沉淀faq,产研不清楚明陛知识,需要扩充哪类知识-知识覆盖的更新效率慢文档实时更新、基于反馈机制自主学习进化提升采纳率(30%)优秀话术采蝌率AIGC答案生成大根蹦过长文档阅读理解自动生成答案IAfBwMW*».11f*itITN*iU.M<M<arvvRfH3vmvM%vm恨.O,l*mARM.4MXlDxMflrXMCI.4r*三JMTia*HWHI三布“RAUaWQKHaiMI.B£.MMW<ft三11xftnaV*3TI.Czl三CJSZ)F提升25%,柒问18准确率某品牌车企,大模型助力用车更轻松客户诉求产品示例汽车手册更杂.Sl识冷启车敛)识维护成本低通过文档解析和切片,减轻客户的的识整理成本1一键导入汽车使用手册传统螭人不雌,应答效果差瞽要跟传燎观Sg人结合大模型增强,传跣机8S人无法回答时,大模型对汽车专业间JE;隹理解S难点:文档庞大,图文混排复杂问答准确率:35%->84%材料数也庞大:有近5(颗车型,每款车涉及使用说明书8K三Jf保养手删,合计几百份材U.手册;昆播复杂:每份手册一百页至几答案出聊提升:模型出图率o%>70%.(gpl出圈率20%)在通用模型星戏上迸行行业精丽,在交规等非手册问答场景准确率提升明显.百页,涉及大gt<:目合.Oa'司穗求严谦:客叫担心幻觉率影响客服对话体验.客户反愫:6月客户担心幻觉及答案出螂低;9、10月持痢第至神嘛隹ms4%;1句客户礴并已正式下单.4大模型问答AP【调用,提高模型的训练效率和成功率。从高速数据接入、模型训练、IP角色对话阅文集团的文生文/文生图大模型精调基于开源/混元大模型的基础上,使用TIONE的大模型工具链模型管理到模型服务的全流程开发支持作家助手为位网文件3配售“专业团队.助柞京创作好故事SZ-Q-助手灵.BSW.旗教练*dt0画师X三B.W<M百顾问MASMS*MA人工与度20%-70%0-20%U70-90%1.2含有部分AlK958ftTNKttA90%-100%1.1I三计机根蹇BHS内容和模板切人工播号Al.AI进行内移审SMO修改.或人工导AtiS行体改Al自主生成内3,并自郎&行虐议.修改.审梗.发布全过咫.无H人工”与