YD_T 4389-2023 AI服务器及能力平台技术要求.docx
《YD_T 4389-2023 AI服务器及能力平台技术要求.docx》由会员分享,可在线阅读,更多相关《YD_T 4389-2023 AI服务器及能力平台技术要求.docx(20页珍藏版)》请在课桌文档上搜索。
1、ICS33.040.40CCSM32YD中华人民共和通信行业标准YD/T43892023Ai务器及能力平台技术要求Technica1.requirementsforAIserversandcapabi1.ityp1.atforms2023T1.f1.实施2023-07-28发布中华人民共和国工业和信息化部发布目次前吉I1.1范附I2规范性引用文件13 术语、定义和缩略语I3.1 术语和定义I3.2 缩略语24 AI能力平台技术要求34.1 总体要求34.2 功能要求44.3 接口要求135 A1.服务器技术要求135.1 总体要求135.2 配置要求145.3 环境要求145.4 云计算技术要
2、求14前言本文件按照GBrr1.j2020标准化工作导则第1部分:标准化文件的结构和起草规则3的规定内容起草,请注意本文件的某些内容可能涉及专利,本文件的发布机构不承担识别这些专利的谎任,本文件由中国通信标准化协会提出并归口。本文件起草的位:中国电信柒团有限公司、中国信息通信研究院、北京百度网讯科技有限公司.本文件主要起草人:陈子开、李锋、高飞、王峰、郭亮、赵继壮、谢明媚、李洁、康亚京、程帅、郑超、张学鹏、王少鹏、黄冠-、高达、程浩然,AI服务器及能力平台技术要求1范B1.本文件规定了A1.版务器的标注平台、训练平台、模型管理平台、模型服务平台、培咄资源平台等子平台的技术要求.本文件适用于AI
3、服务平台的设计、建设及服务器设备选型参考。2规范性引用文件卜列文件对于本文件的应用是必不可少的.凡是注日期的引用文件,仪所注日期的版本适用于本文件。凡是不注日期的引用文件,其域新版本(包括所有的修改单)适用于本文件,GBT34990-2017信息安全技术信息系统安全管理平台技术要求和测试评价方法GB/T37956-2019信息安全技术网站安全云防护平台技术要求3术咻定义和语下列术语和定义适用于本文件.3.1术语和定义3.1.1模型mode1.训练完的结果文件和配设文件集合(包括网络结构、参数等13.1.2弓障engine将模型部署为稳定服务时,模型可进行推理的容器环境.3.1.3能力abi1.
4、ity模型部署完成后提供稳定访问的服务,能力部署时包括模型和引擎两个部分。注:业务层需提供一个管理功能,对各能力有版本、谓用权限的管理,3.1.4数据9(处理dataprprardVideoMouseOCR光学字符识别Optica1.CharacterRecognitionPCIE高速外设互联标准Periphera1.ComponentIn1.eruiHinectExpressRAID独立磁盘冗余阵列RedundantArrayoIndependentDisksSAS串行连接SCS1.接口Seria1.AttachedSCSISATA串行高级技术附件Seria1.AdvancedTechno1
5、.ogyAttachmentSNMP简单网络管理出议Simp1.eNCIWorkManagementProIOCO1.SSD固态硬盘So1.idStateDrives4A1.能力平台技术要求4.1 总体要求4.1.1 A1.能力平台总体柒构AI能力平台应采用分层次、结构化设计思想实现高内聚低耦合的功能架构,能修灵活适应业务的发展与变化.具体如Ka)异构计算层:计算基础资源层,应提供GHkCPU计算资源,并考虑支持FPGA等其他类计算资源.b)I计算引擎:应支持各类成熟开源的深度学习框架,可用于进行各类人工智设神经网络模型的训练,以及人工智能模型的分布式运行支探.平台应内置成熟的开源深度学习框架
6、,提供主流通用的AI深度学习和机器学习模型(包括且不限于SK1.eam、Tesoif1.ow.Keras,Pxtoivh.Caffe等)。0标注平台:应实现数据的标注工作,包括图像、语音、文木等标注,宜实现标注任务分配、任务监控、标注人员管理、标注页面、标维管理等.d)训练平台:应实现业务场景管理、数据集管理、模型训练、生命周期管理与发布等工作,模型训练中应支持自动化训练,选定自动化训练后,平分可自动进行数据的预处理、数据采样、数据分别、模型训练、模型脸证、模型选优、桢型测试等工作,最终自动输出最优模型.OAI通用能力服务:负责A1.能力管理和展现、在线预测等。应提供包括智能语音、计算机视觉、
7、自然语言处理等在内的通用能力.OAI能力平行运营管理:是A1.能力平台的管理门户,统一出入口,统一管理数据、能力、运营管理训练等各类操作,保障系统整体安全.应提供CPU、GPUi1.算资源的按需分配调度设力,提供业务容化系统服务.4.1.2 AItK力平台内部鲁梆魅系A1.能力平行各模块之间的关系可以归结如3a)标注平台对训练数据型进行标注,b)标注平台将原始文件与标注结果进行存储.c)训练平台从标注平台获取己完成标注的数据集信息,d)训练平台从存储池扶取训练数据和标注数据.)训练平台调用训练引擎进行训练。D训练结束,训练引擎返回训练结果。R)训练平台将训练完成的AI能力发布到AI超市。h)A
8、I能力平台负贡AI能力管理和展现、在线预测等。4.2 功要求4.2.1 峰注平台标注平台应支持用户上传私有数据或同步共享范围内的共有数据,标注平台对数据进行标注,产生带标签的样本集,包括数据标签辉、数据标注引擎、标签索引。标注平台应实现对标注工具的配置管理,包括对文本类、图片类、语音类、视顺类等进行标注时的不问工具,同时,标注平台应配翼多轮标注和多轮检杳,满足单个标注任务和数据可以经过多个用户审核确认,来保证标注结果的准确性。至少支持选举模式和检杳模式两种标准模式。4.2.1.1 耐E标注项目管理应实现标注项目的全流程管理,包括项目的创建和维护、项目的查看、进入项目创建任务等功能,其中项目的创
9、建和维护应支持项目分类管理,创建标注项目依据应是以业务作为驱动,即以标注业务类型进行项目的划分.4.2.1.2任务发布发布任务过程中,应支持图片文件与操作员之间关联,发布任务成功后,图片文件与具体操作员建立操作关联关系。打标任务创建在项目之3单个项目可支持创建多个打标任务,打标任务由文件、标注员、审核员、起止时间、提醒时间、抽样率、质检、验收合格率等元索组成在默认设置下,每个任务都应支持多标注员和审核员的参与,人员之间平均分配图片,每张图片只发布一次.在自定义设置下,应自定义最大发题量(一张图最大支持发布的数量),支持一张图片发布给多个人。平台应支持用户自定义抽样率,在设置完抽样率后,可对标注
10、后的文件迸行抽样审核。抽样率应体现到每个标注员上,以便从标注员的维度统计抽样文件数.4.2.1.3ft*2E打标视图主要由三部分组成,包括图片列表、打标区域、标零列表.其中图片列表用于选中打标的图片,打标区域即在图片上进行图形标注行为,标签列表给出图像相关联的标签。4.2.1.4妍种审核人员对标注员标注的图片进行审核实现审核任务处理和标注信息隐藏功能。4.2.1.5标签理标签管理实现时标注所用标签的统管理功能,要求实现以下内容,a)标签的划分应由行业、标签分类组成,即系统有多个行业,每个行业卜可支持多个标签分类.彩个标签分类卜由若干个标签组成b)行业、标签分类、标签应能区分是系统定义,还是自定
11、义。C)应支持每个标签,和唯一Code的对应.code为系统随机分配,不允许用户进行修改,避如Ode被重现使用从而造成标笠的错误d)标签发布后,管理员在任务分配上进行配置时,同一类的标签应有限制条件,避免类似同关瑕疵被定义成多种瑕疵的错误。C)标签管理之用户权限:审核员及标注员,应支持只查看标签管理页面,不允许对标签进行编辛t修改等操作:项目管理员、客户管理员及系统管理员应支持对自定义标签模块进行增删改查等操作;中心管理员应支持对系统标签进行增删改查。4.2.2训练平台提供场景的构建、数据集的管理,以及模型自动化训练、模型生命周期管理、模型发布等。422.1IHHUB场景视图要求实现以卜内容.
12、a)应提供仪表欢来展现该用户权限可见下的场景数收、各类型场景数后、模型数信、模型已发布故城、模里发布率、AP1.服务调用次数、AP【服务调用次数环比等指标,点击指标应可以查看详情列表.b)应提供服务排名功能,点击某个服务,展现该服务一周内的调用次数趋势图,C)应提供训练任务、标注任务的监控视图,包括总数、完成情况等.可以查看详情列表.42.2.2Ma应提供根据场景名称、场景类型搜索的功能,场景应包括场景名称、场景类卷、场景描述、创建人、创建日期、操作等属性.a)场景新增:支持向导式创建场景。1)应支持根据任务类里来进行场景类型的选择,至少应包括OCR、图像分类、目标物体检测3种任务类型.2)应
13、支持场景的基本信息配W.,例如场景名称、场景描述、场景编码等信息.3)场景新建成功提示,应显示场景配置信息,包括场景类型.场景名称、场景埸码、场景描述察4)应提供数据臾新建、快狗训练等相关链接,方便用户具备一次操作完成的界面能力,b)场景修改:应支持从场景管理中选择并修改已有场景修改场景名称、编码.描述等属性.O场景删除:应支持从场景管理中选择并删除已有场景.场景捌除的同时,会眦除该场景下已经创建的模型,且无法恢复。4.2.2.3数据管理实现平台所有数据集的统管理功能,并根据用户权限支持数据隔离与数据共享,要求实现以下内容。a)提供已有数据然管理能力,应支持根据数据集名称进行搜索。b应支持展现
14、该用户权限卜所有数据集,包括数据集名称、图片数量、已标注数过、创建人*&J建口期、数据描述、操作等属性.c)提供数据集查看、删除.追加等操作。d)提供新增数据集入口,支持大文件上传与下鼓.e)应支持数据隔黑、共享及在流程中的传递。4.2.2.4 mm支持用户自主训练模型,提供模型训练流程中开始训练、停止训练、模型发布、服务验证、关闭服务等各节点的操作,并对模型训练状态和发布状态进行分类,完成不同状态模型的统管理,a)应支持模型管理的能力,包括场景和数据集支撑同一个场景多次训练,支持数据集更改。b)应支持模型开始训练、停止训练、模里发布、关闭服务、服芬验证、删除等操作;训练状态有训练完成、训练中
15、、训练异常、待训练4种状态:模型发布有已发布、未发布两种状态“C)应支持后续新增版本时,与上次版本的时比结果杳看功能.d)待训练模型应支持开始训练、删除操作。e)训练中模型应支持停止训练操作,同时状态更改为待训练状态。f)训练完成产生模型版木,设定为初始版本,后续随着多次训练自动费期版本,支拉删除、模型发布、开始训练等操作。发布状态初始为未发布,并支持校型发布功能模型发布时同时更新发布类型、地址等属性。B)训练完成旦未发布的模型,应支推删除、开始训练、模型发布等操作.h)训练完成且已发布的模型,应支撑删除、开始训练、关闭服务.服务验证等操作。如果关闭服务,发布状态更改为未发布.i)训练异常状态
16、,应支撑开始训练、删除等操作。j)应提供AP1.或者SDK等方式发布模51。4.2.2.5 稣引掌训练引擎应包括提供琪础算法能力和自动化训练等功能,a)提供以下基础算法能力。D图像分类:应包括InCePIion、ReSNeI、PNASNet.DenSeNet等.2)目标检测:应包括SSD、YO1.O、Faster-RCNN,RFCN等,3)文本检测:应包括YOIQ、CTPN等.4)文本识别:应包括CRNN、DenSeNct等.b)自动化训练应支持数据增强、并行训练、自动调参、模型选优、评价发布等功能.D数据增强:通过裁剪/缩放/平移/颜色变化等调整图片的方法增加训练集的样本敢,使训练出来的模型
17、具有更好的泛化能力。2)并行训练:对r每一种算法和年一食多数并行进行训练,以加快自动训练的过程,缩短训练所襁时间,3)自动调参:对于每一种尊法,都应自动调节出多套超参数进行训练,每一套参数在训练过程中还会在不同的训练时间和训练步数下自动保存多个模型,使每一种尊法都会训练出多套不同的模型.4)模型选优:综合多种算法及多食参数训练出来的模型,在舱证集上进行评估球终选择出公优的模型。5)评价发布:取得最优模型后,在测试集上评价该模型的性能指标,反馈该模型的效果,并烦后将模型发布到可用的AH列表中供外部使用.4.2.3 A1.应用市用A1.应用市场主要提供模型的展现、用户体验预测等功能.4.23.1
18、场景分类应支持从自然语言处理、图片文字识别、图像识别、人脸识别四大模块展现已完成的模型效果,每个模块进行细分子项A1.能力,使用者可以根据需要选择时应的场景模型诳行使用或者体照。4.23.2 24SUSff1.应提供界面对模型部署完成后的应用进行接口调用功能.并支持对模型进行评价.a)提供界面体验应用能力,同时支持利用AP1.SDK等方式进行接口调用。b)应支持模型评价功能,可从产AA功能、模型准确率等指标迸行评价。4.23.3 3计分析统计分析应提供以下信息的统计与展示。a)应支持统计当前在线用户数、历史总用户数两个指标.可以根据评价次数、访问次数来展示用户最近一个月内的使用次数趋势图.b)
19、应支持用户周期内的使用情况分析,可以根据统计周期、统计增(评价次数、访问次数等)进行切换,C)应提供产品评价情况.量化展现模型的评价结果.d)应提供用户讨价趋势,展现用户也近一月内每天的总体评价情况,客户体验是否有提升.4.2.4 通用能力应提供OCR、图像、视频语音语义、自然语言处理、知识图谱、推荐等通用能力服务。4.2.4.1 OCR能力应提供以卜OCR识别能力.a)照片文字特写:识别照片(图片)中的文字.b)身份证识别:证件号码识别、稽核.c)合同文档解析:合同转文字.d)简历内容解析:简历特文字。O增值税发票识别:发票真伪验证.D合同用堂(或签名):真伪识别。g)供应商资质证明识别:证
20、明文件真伪识别.h)学位证书识别:头像脸证,证件号码识别和验证。i)其他(通用文字、手写体、网络图片、银行卡、出租车票、通用票据、护照、名片、营业执照、表格文字、火车票、行驶证、驾驶证、车牌识别)4.2.4.2应提供以卜罔像能力.a)人脸检测、人脸脱证和识别、人脸对比、活体检测、人脸特征提取分析(多人脸检测、湾年龄人脸识别、五官定位、人脸搜索b)色情内容过浊.C)舜恐敏感信息过述.4.2.4.3 g。商标检测0e)手势识别、人体憎测。0通用图像识别。g)场处/物体识别.h)广告检测。i)图文审核等,4.24.3应提供以卜视频能力.a)视频风险内容识别.b)人体关键点检测,c)人流In统计。d)
21、人体属性检测.e)运动轨迹识别。4.2.4.4应提供以下语音能力.a)语音识别:语音转文字(长语音识别、远场语音识别)。b)语音合成:文字转语音,c)性别年龄识别。d)语音指令、语音唤醒。e)语音关键词检索,O音频文件转弓。42.45语义助应提供以下语义加力.a)本体构建。b)关系抽取.c)知识融合。d)关系推断。C)属性决策.,0语义搜索。4.2.46自然删联理财应提供以卜自然语言处理能力.a)词法分析:分词,词性标注、命名实体识别NER,能帔识别出文本事中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。b)情感倾向分析:针对带有主观描述的中文文本,自动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- YD_T 4389-2023 AI服务器及能力平台技术要求 4389 2023 AI 服务器 能力 平台 技术 要求

链接地址:https://www.desk33.com/p-1692102.html