2022中国人工智能芯片行业研究报告.docx
随着人工智能新兴产业的高速发展,传统的芯片已不能满足人工智能产业对芯片性能及算力等方面的要求。因此,如何构建出高效的人工智能芯片,将芯片技术与人工智能技术有效地结合起来成为当前的热点话题。人工智能芯片领域的研究,或将科技发展推向一个更高的阶层。亿欧认为,人工智能芯片作为人工智能及相关应用的基础与核心,必将迎来光明的未来。本报告对Al芯片主流类型进行拆解分析,展现中国人工智能芯片的发展现况,探究其发展的困境和机遇,希望能为广大从业者和各方关注人士提供有益的帮助。本报告核心观点:政策扶持和市场需求仍是人工智能芯片发展的主要驱动力。据亿欧智库测算,2025年,中国人工智能核心产业市场规模将达到4000亿元,其中基础层芯片及相关技术的市场规模约1740亿元。四大类人工智能芯片(GPU、ASIC.FGPA,类脑芯片)及系统级智能芯片在国内的发展进度层次不齐。用于云端的训练、推断等大算力通用芯片发展较为落后;适用于更多垂直行业的终端应用芯片如自动驾驶、智能安防、机器人等专用芯片发展较快。超过80%中国人工智能产业链企业也集中在应用层。未来,中国人工智能芯片行业挑战与机遇并存。技术上,由于基础理论、关键设备等仍落后与国际一流水平,瓶颈较难突破,因此芯片制造环节仍有所差距,但垂直行业应用的芯片设计及相关企业的数量上,中国仍占据较为优势的地位:在算法上,除了创新计算范式的研发,“数据孤岛”问题也将在政策的指导下得到解决,为Al算法提供更大量、更准确的数据集进行学习与训练;应用上,消费电子、自动驾驶、智慧安防、机器人等仍是较为主流的应用方向,政策指导使产业获得更好的联动性,同时,人工智能逐步横向往媒体、医疗、教育等行业渗透与拓展。总体来看,人工智能芯片的发展仍需基础科学积累和沉淀,因此,产学研融合不失为一种有效的途径。充分利用企业、高校、科研机构等多种不同的教育环境与教育资源,将理论知识传授与产业工程实践、科研实践相结合,培养并积累人工智能领域优质人才,维持中国人工智能及芯片行业的可持续发展。目录CTont E nt s-中国人工智能芯片行业发展现状二人工智能芯片行业解读OL技术层面02.应用层面03.典型企业三中国人工智能芯片行业的挑战与机遇研究主体界定:面向人工智能领域的芯片及其技术.1法与应用“无芯片不AI”,以Al芯片为载体实现的算力是人工智能发展水平的重要衡量标准。广义的Al芯片:专门用于处理人工智能应用中大量计算任务的模块,即面向人工智能领域的芯片均被称为Al芯片。狭义的Al芯片:针对人工智能算法做了特殊加速设计的芯片。本报告将对针对狭义的Al芯片即人工智能算法做特殊加速设计的四种主流芯片GPU、ASIC、FPGA、类脑芯片以及系统级AI芯片技术、实现Al的主流算法及在场景中的应用情况进行解析。应用层终端产品智慧金融智慧医疗教育无人驾驶营销智能安防智能制造智慧城市智慧零售智能家居技术层通用技术自然语言处理计算机视觉语音识别机器学习算法机器学习增强学习深度学习技术框架分布式储存分布式计算神经网络基础层数据通用数据行业大数据系统智能云平台大数据平台硬件GPU/FPGA等加速硬件智能芯片来那颂斛饮螂糊!ZX在场景应用中,利用人工智能学科技术解决生产生活的问题。/常用的算法与技术等,解决人工智能应用中的核心计算问题。人工智能应用中完成大量运算所需的硬件、模型训练所需的数据及数据处理平台等。AI芯片的发展历程:模仿人脑建立的模型和算法与半导体芯片发展交替进行人工智能算法需要在计算机设备上实现,而芯片又是计算机设备运作的核心零件,因此Al芯片的发展主要依赖两个领域:第一个是模仿人脑建立的数学模型与算法,第二个是半导体集成电路即芯片。优质的算法需要足够的运算能力也就是高性能芯片的支持。亿欧智库2019年发布Al芯片行业研究报告认为,人工智能于芯片的发展分为三个阶段:第一阶段由于芯片算力不足,神经网络算法未能落地;第二阶段芯片算力提升,但仍无法满足神经网络算法需求;第三阶段,GPU和新架构的Al芯片促进了人工智能的落地。A目前,随着第三代神经网络的出现,弥合了神经科学与机器学习之间的壁垒,Al芯片正在向更接近人脑的方向发展。亿欧智库:人工智能与半导体芯片的发展进程对照19401960198020002020神经网络模型感知器HQPfieId 网络新的DNN算法FPGACPU(MCU)基于深度学习类脑芯片 的Al芯片晶体管第一块芯片半导体 芯片神经网络芯片中国政策环境:在政策的引导支持下,中国人工智能芯片市场持续快速发展芯片产业是信息产业的核心部件与基石。当前,我国芯片高度依赖进口非常不利于国家安全与行业发展。因此,近年来国家高度关注人工智能芯片产业的发展,发布一系列产业支持政策,为人工智能芯片行业建立了优良的政策环境,促进行业的发展。2021年,“十四五”规划纲要和2035年远景目标纲要指出,“十四五”期间,我国新一代人工智能产业将聚焦高端芯片等关键领域。从国家战略高度为人工智能芯片行业建立了优良的政策环境。各地方也根据各自的背景与条件,发布促进和扶持人工智能产业发展的方案方针。截止2021年9月,包括北京、天津、上海、江苏、福建等20余省、市、地区发布人工智能相关政策,进一步支持引导人工智能及芯片产业发展。亿欧智库:2016-2021年中国人工智能芯片相关政策梳理年份政策相关内容2016年发改委互联网+”人工智能三年行动实施方案对人工智能芯片发展方向提出多项要求,并促进智能终端可穿戴设备的推广落地。2017年国务院新一代人工知恩感发展规划重点突破高效能、可重构类脑计算芯片和具有计算机成像功能的类脑视觉传感器技术,研发具有学习能力的高效能类脑神经网络架构和硬件系统,实现具有多媒体感知信息理解和智能增长、尝试推理能力的类脑智能系统。2017年工信部关于促进新一代人工智能产业发展三年行动计划按照“系统布局、重点突破、协同创新、开放有序”的原则,在深入调研基础上研究提出重点发展智能传感器、神经网络芯片、开源开放平台等关键环节,夯实人工智能产业发展的软硬件基础。2019年关于促进人工智能和实体经济深度融合的指导意见把握新一代人工智能的发展特点,结合不同行业,不同区域特点,探索创新成果应用转化的路径和方法,构建数据驱动、人机协同、跨界融合的智能经济形态。2021年“十四五”规划纲要和2035远景目标纲要我国新一代人工智能产业将着重构建开源算法平台,并在学习推理与决策、图像图形等重点领域进行创新,聚焦高端芯片等关键领域。娴公峭伍她博理中国市场环境:需求是主要驱动力,边缘然端芯片市场将持续增长。>2018年12月,中央经济会议把人工智能与5G、工业互联网、物联网等定义为新型基础设施建设,各行业数字化转型加速,产生了更多样化的人工智能产业应用数据和更复杂的深度学习算法需求。目前,中国人工智能产业链中,应用层企业比例超过80%,结合场景的应用落地是人工智能产业的主要驱动力。>根据亿欧智库数据,中国人工智能企业的十大应用技术领域中,计算机视觉、机器人、自然语言处理、机器学习、生物识别占比居前五;企业服务、机器人和通用方案以及安防、汽车是AI应用的主要方向,边缘/终端芯片需求将持续增长。亿欧智库:2021年中国人工智能产业链分布亿欧智库:2021年中国Al企业技术领域占比基础层技术层应用层计算机视觉数据挖掘机器学习钾能语言技术其他自然语TT处理 知识图谱 生物识别芯片 SLAM来假.1嘟公脚:卜依科辙里市场规模测算:市场规模平稳增长,产业融合加速人工智能整体市场已从2020年的疫情影响中恢复,同时,随着技术的成熟以及数智化转型升级,内在需求增加,中国人工智能核心产业市场规模将持续平稳增长,预计2025年将达到约4000亿元。随着大算力中心的增加以及终端应用的逐步落地,中国Al芯片需求也持续上涨。2021年疫情缓解,市场回暖,产生较大增幅;类脑等新型芯片预计最早于2023年进入量产,因此2024及2025年或有较大增长,预计市场规模将于2025年达到1740亿元。三JT御俵院WZWZ中国投资环境:资本持续进入,交易金额均超亿元相较2020年,人工智能领域投资数量有所减少,但单笔投资规模呈上升趋势。Al芯片产业也持续有资本进入,单笔融资金额均超亿元。截止2022年1月,2021年中国人工智能芯片相关领域融资事件共计92起,总金额约300亿人民币。亿欧智库:2021年中国人工智能芯片交易事件及金额亿欧智库:中国人工智能芯片交易事件(部分)-截止2022年1月企业时间阶段金额I燧原科技2021-01-05C轮18亿元沐曦集成电路2021-01-18Pe-A轮数亿元天数智芯2021-03-01C轮12亿元壁仞科技2021-03-30B轮数十亿元智残芯半导体2021-04-07A轮数亿元地平线2021-06-10C系列15亿美元埃瓦智能2021-07-16A轮数亿元星云智联2021-07-23Pre-A轮数亿元后摩智能2021-07-27A轮未披露灵汐科技2021-08-19战略投资未披露芯启源2021-11-03A轮数亿元安路科技2021-11-12已上市13.03亿元瀚博半导体2021-12-20B轮16亿元中科驭数2021-12-21A+轮数亿元墨芯2022-01-12A轮数亿元深聪智能2022-01-11A轮数亿元亿欧智库:中国人工智能技术方向岗位供需情况4.52/嫡邕獴S砂3湃Z /中国人工智能芯片人才市场:各领域人才缺口仍较大,国家开始重视人才培养Al芯片的实现包含软件和硬件两个方面。既需研究高效率的智能算法,同时要研究如何将这些算法结合在半导体硅片上,形成最终的产品。目前.,仍有部分企业在人才招聘中遇到不少阻碍,人才缺乏、成本高是主要的问题。根据工信部人才交流中心发布的数据显示,人工智能不同技术方向岗位的人才供需比均低于0.4,其中人工智能芯片岗位人才供需比为0.32,机器学习、自然语言处理等技术人才供需仅0.2。国家也开始重视人工智能相关人才的培养,中央及各地方政府出台了多个人才培养与引进相关政策;在2018-2021年,超过300所高校开设了人工智能专业;部分企业也开始与高校进行合作,以产学研合作教学模式共同培养综合能力突出的优质人才。亿欧智库:人才培养相关政策2018年4月高等学校人工智能创新行动计划 加快人工智能领域学科建设,支持高校在计算机科学与技术学科设置人工?能学前方向; 加强人工智能领域专业建设,推进“新工科”建设,形成“人工智能+X”复合专业培养新模式; 加强人工智能领域人才培养,加强人才培养与创新研究基地的融合,完善人工智能领域多主题协同育人机制。 构建人工智能多层次教育体系。2020年1月"双一流”建设高校促进学科融合加快人工智能领域研究生培养的若干意见 鼓励人工智能龙头企业根据产业技术的最新发展和对人才培养的最新需求,提供试验实践环境,对高校教师开展培训; 以双聘等灵活聘用方式吸引企业和科研院所优秀人才到高校开展科学研究和人才培养; 依托“双一流”建设高校,建设国家人工智能产教融合创新平台,鼓励企业参与共建,在资金、项目等方面优先支持。注:人才供需比=进入该岗位的人才意向数量/岗位需求数量11中国AI芯片产业图谱亿欧智库:中国人工智能芯片产业图谱2a龙福m科1.oongsonTBCHNoLfoGYIZambriron寒武纪VrYIIIMYll三三nx豪嘉微AILIIMA沐曦集成电路JlZGJlArIIClKlKxilinx厚LoGlC君正Ingenic.八a天数智芯E9nIforintlU9f>cSiroyweinmiwSynSense时I识I科I技令昆仑而Kunlunxin口紫光展锐UtlISOCCorerain能云科技/EnflameatatMaC*CoreC,CorTtchnologyCoJ,td.7*LynxiTU工灵汐科技地平线FHorizonRoboticeGO纱IN高云匚警酷nR噌娼回紫光展锐UMISOCartasqn®.A;如疾瓦酷芯微电孑ChipIftUIIi启英泰伦blackSESAMETECHNOLOGIESCorerain岷云科技1.GLEHFLYQImaginationAllnimer与光科技SEETRUM安谋科技armchina01.技术层基于技术架构.部署位置及实践目标的Al芯片分类> Al芯片一般泛指所有用来加速Al应用,尤其是用在基于神经网络的深度学习中的硬件。> AI芯片根据其技术架构,可分为GPU、FPGA、ASIC及类脑芯片,同时CPU可执行通用AI计算,其中类脑芯片还处于探索阶段。> Al芯片根据其在网络中的位置可以分为云端AI芯片、边缘及终端Al芯片;根据其在实践中的目标,可分为训练(training)芯片和推理(inference)芯片。>云端主要部署训练芯片和推理芯片,承担训练和推理任务,具体指智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。技术架构种类定制化程度可编辑性算力价格优点缺点应用场景GPU通用型不可编辑中高通用性较强且适合大规模并行运算;设计和制造工艺成熟并行运算能力在推理端无法完全发挥高级复杂算法和通用性人工智能平台FPGA半定制化容易编辑高中可通过编程灵活配置芯片架构适应算法迭代,平均性能较高;功耗较低;开发时间较短(6个月)量产单价高;峰值计算能力较低:硬件编程困难适用于各种具体的行业ASIC全定制化难以编辑高低通过算法固化实现极致的性能和能效、平均性很强;功耗很低;体积小;量产后成本最低前期投入成本高;研发时间长(1年):技术风险大当客户处在某个特殊场景,可以为其独立设计一套专业智能算法软件类脑芯片模拟人脑不可编辑高-最低功耗;通信效率高;认知能力强目前仍处于探索阶段适用于各种具体的行业GPU:从图形处理器到通用数据并行处理器>GPU(GraPhiCSProeeSSingUnit)图形处理器最初是一种专门用于图像处理的微处理器,随着图像处理需求的不断提升,其图像处理能力也得到迅速提升。目前,GPU主要采用数据并行计算模式完成顶点渲染、像素渲染、几何演染、物理计算和通用计算等任务。因其超过CPU数十倍的计算能力,已成为通用计算机和超级计算机的主要处理器。其中通用图形处理器GPGPU(Genela!ProposeComputingonGPU)常用于数据密集的科学与工程计算中。>英伟达与AMD仍占据GPU霸主地位,2018年至今,国产GPU也积极发展中,已有部分产品落地。ControlALUALUALUALUCacheDRAM& lj1h,7 撮 I 阮亿欧智库:CPU和GPU对比CPUGPUGPU计算浮点计算能力110适用场景运算方式串行并行带宽内存带宽小高显存带宽-运算密集-高度并行延迟通过大的缓存保证访问内存的低延迟。直接访问显存因此延时较长。-控制简单-分多个阶段执行CPU也触逊惮元Iiu动懒WM4三亿欧智库:GPU的开发环境- CG(CforGraphics):为GPU编程设计的高级绘制语言,由NVlDlA和微软联合开发,微软版本叫HLSL,CG是NVlDlA版本。- CUDA(ComputeUnifiedDeviceArchitecture,统一计算架构):由NVlDlA所推出的一种集成技术,是首次可以利用GPU作为C-编译器的开发环境。可以兼容OPenCL或者自家的C-编译器。- ATIStream:AMD针对旗下图形处理器(GPU)所推出的通用并行计算技术。利用这种技术可以充分发挥AMDGPU的并行运算能力,用于对软件进行加速或进行大型的科学运算。- OpenCHOpenComputingLanguage,开放计算语言):为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。亿欧智库:GPU体系的发展趋势- 增加计算资源密度增强通信能力和可靠性- 提高存储体系性能和功能降低功耗ASIC与FPGA:AI芯片领域兵家必争之地>FPGA全称是FeIdPrOgramilmbIeGateArray:可编程逻辑门阵列,是一种“可重构”芯片,具有模块化和规则化的架构,主要包含可编程逻辑模块、片上储存器及用于连接逻辑模块的克重购互连层次结构。在较低的功耗下达到GFLOPS数量级的算力使之成为并行实现人工神经网络的替代方案。>ASIC(Application-SpecificIntegratedCircuit)是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。ASIC从性能、能效、成本均极大的超越了标准芯片,非常适合AI计算场景,是当前大部分Al初创公司开发的目标产品。 可加速上市进程:开发时间较短,且无需布局、掩膜等制造步骤。 非提前支付的一次性开支:这些均是ASIC设计中需要的开支。 更简化的设计周期:可通过设计软件处理布线、布局及时用争问题。 更具预测性的项目周期:消除了潜在的重新设计和晶圆容量等。 现场可重编功能:可以远程上传的新比特流,通过软件实现自定义硬件功能。FPGA静态时序分析(STA)功能描述功能描述IASIC电路设计与输入I功能仿真模块划分I模块编码输入IASlC设计中往往要用到FPGA进行原型验证综合优化模块级仿真验证综合后仿真I实现与布局布线I时序仿真板级仿真与验证I调试与加载配置物理设计(布嘉刁等价性检验I静态时序分析1亿欧智库:芯片设计流程与设计优势对比 完整的定制功能与更小的尺寸:由于器件是根据设计的规格进行生产的(注:ASlC芯片也分为全定制和半定制)O 更低的器件成本:实现大批量设计与生产,批量越大,成本越低。 高性能、低功耗:ASIC芯片相当于将Al算法“硬件化”,特定算法下能效更高。 可形成IP核复用:模块化的设计方法,可根据设计需要进行IP选取。17ASlC与FPGA:功能与市场定位不同,竞争关系不明显>FPGA具有开发周期短,上市速度快,可配置性等特点,目前被大量的应用在大型企业的线上数据处理中心和军工单位。ASIC一次性成本远远高于FPGA,但由于其量产成本低,应用上就偏向于消费电子,如移动终端等领域。>目前,处理器中开始集成FPGA,也出现了可编程的ASlC同时,随着SOe的发展,两者也在互相融合。亿欧智库:ASIC&FPGA总体对比亿欧智库:ASIC&FPGA技术与商业化对比FPGAASIC运算速度FPGA结构上的通用性必然导致冗余;另外,不不同结构间的时延也不可忽略。,结构上无特殊限制,设计时也可将特定模块靠近减少延迟芯片规模实现相同的功能时,需要的FPGA实现相同的功能时,ASlC的规模功耗相同工艺条件下,功耗相同工艺条件下,功耗成本几乎无开发工具和风险,主要成本都在单片上。由于进入生产后硬件不可更改,开发工具和流片过程可能产生大量成本运行过程加载配置进入存储器需要时间可立即运行产品定位适用于项目产品需要灵活变动等方面的产品及产品要求快速占领市场的情况适用于设计规模较大,或应用成熟的产品如消费电子等发展方向大容量、低电压、低功耗、SoC更大规模、IP复用技术、SoC基于不同硬件实现方式的AI芯片:系统级芯片在手机、可穿戴设备等端设备中,很少有独立的芯片,AI加速将由SOC上的一个IP实现。SoC(System-on-chip,片上系统)作为ASIC设计方法学中的新技术,始于20世纪90年代中期,是以嵌入式系统为核心,以IP复用技术为基础,集软、硬件于一体的集成芯片。在一个芯片上实现信号的传输、存储、处理和1/0等功能,包含嵌入软件及整个系统的全部内容。由于高集成效能,SoC已经成为微电子芯片发展的必然趋势。亿欧智库TSG整体桀构外部存储器控制器EMIBUS系统控制模块各种接口亿欧智库:SOC的优势.降低耗电量:SoC多采用内部讯 号的传输,大幅降低功耗。 减少体积:数颗C整合为SQC,有 效缩小电路板上占用的面积。 丰富系统功能:可整合更多的功 能元件和组件,丰富系统功能。 提高速度:内部信号传输距离缩 短,信号传输效率提升。节省成本:IP复用,有效减少研发 成本,降低研发时间。亿欧智库:SoC产业发展趋势 平台化设计:有效提高设计生产 力从而应对由应用面导致的市场:区隔的细化。;供应链之间合作加强:IC设计、IC制造、封装、测试、半导体设:备、IP、IC设计服务与EDA业者:等,牵连到的各产业部门非常广 泛,合作将进一步加强。:分工将更加明确:SoC行业或将 分为IP核设计和系统级集成两部分。亿欧智库:SoC芯片制造流程流程设计制造技术挑战- 软硬件协同设计- 芯片硬件设计:包括功能设计阶段、设计描述和行为级验证、逻辑综合、门级XOoO8验证和布局与布线。- 核心挑战:IP复用- 与芯片制造流程相同,包含晶圆制造、光刻、掺杂等流程。- 核心挑战:克服不同电路区块之间制程相容性问题,即迁就微缩进展较慢的功能区块或在成本上找到平衡。:-打线为主的传统封装己无法满足需要,晶片级封装及I/O高脚位锡:球封、CSP(ChipScalePaCkaggg)等将是未来Se)C封装:技术的主流。:-核心挑战:更多的端口数目。-SOC趋势下,测试机台走向多功能单一机型,测试各种逻辑、模拟与存储电路。核心挑战:SOC设计中的多样性使得验证更加困难。基于不同计算范式的AI芯片:类脑芯片CPUGPUGFPGA/ASlC及SOC是目前用的较多的Al芯片,此类Al芯片大多是基于深度学习,也就是深度神经网络(DNN),以并行方式进行计算的芯片,此类Al芯片又被称为深度学习加速器。如今,模仿大脑结构的芯片具有更高的效率和更低的功耗,这类基于神经形态计算,也就是脉冲神经网络(SNN)的芯片为类脑芯片。目前.,部分企业产品已进入小批量试用阶段,类脑芯片最快将于2023年成熟,能效比有望较当前芯片提高2-3个数量级。亿欧智库:中国类脑芯片发文数量:(2014-2022.01 )亿欧智库:DNN与SNN对比发文数量DNNSNN训练方式需大量数据单个数据样本学习方式监督学习无监督学习输入类型图像帧或数据 阵列脉冲时延高极低(接近实 时)神经元模型复 杂程度低高功耗由处理器与储 存器存取决定由每个事件功 耗决定分类精度较高较低分类速度低高较研究阶段较成熟探索及部分小 规模试用阶段亿欧智库:类脑芯片的硬件实现方式;忆阻器:在紧凑性、可靠性、耐用性、存储器保留期限、可编程状态和能效等方面的特性,有利用成为电子突触器件。:自旋电子器件:其不易失性、可塑性及振荡和随机行为,允许创建模仿生物突触和神经元关键特征的组件。光子器件:利用半导体放大器中使用的非线;性光学增益介质,实现神经形态计算所需的:功能。;电化学器件:具有高精度、现行和对称的电;导效应,低开关能量和高扩展性,使用于:SNN的内置定时机制。;二维材料:包括过渡金属二硫族化合物、石;墨烯等,可开发成为人工突触。;AI芯片发展:向着更低功耗.更接近人脑.更靠近边缘的方向现在用于深度学习的Al芯片(包括CPU、GPU、FPGA.ASIO为了实现深度学习的庞大乘积累加运算和并行计算的高性能,芯片面积越做越大,带来了成本和散热等问题。Al芯片软件编程的成熟度、芯片的安全,神经网络的稳定性等问题也未能得到很好的解决,因此,在现有基础上进行改进和完善此类Al芯片仍是当前主要的研究方向。最终,Al芯片将近一步提高智能,向着更接近人脑的高度智能方向不断发展,并向着边缘逐步移动以获得更低的能耗。檄公降世懒谈做y描硼.AI芯片可实现的功能人类特征传感器Al芯片感知:视觉、听觉、触觉等人体类脑芯片及深度习芯片)识别、分类、决策、预测、分析、推理人脑未来带意识、带自主性的芯片情感、想象力、创造力等人性亿欧智库:Al芯片与人类智能21亿欧智库:计算范式及其硬件实现方法檄公降世懒谈做y描硼.模拟计算孩而痔传统模拟架构通过模数/数模转换器将模拟信AI芯片发展:计算范式创新方向及其硬件实现>AI硬件加速技术已经逐渐走向成熟。未来可能更多的创新会来自电路和器件级技术的结合,比如存内计算,类脑计算;或者是针对特殊的计算模式或者新模型,比如稀疏化计算和近似计算,对图网络的加速;或者是针对数据而不是模型的特征来优化架构。同时,如果算法不发生大的变化,按照现在AI加速的主要方法和半导体技术发展的趋势,或将在不远的将来达到数字电路的极限(约1到10TFlopsW),往后则要靠近似计算,模拟计算,甚至是材料或基础研究上的创新。存内计算- 核心问题:传统冯诺伊曼架构中,计算与内存是分离的单元,内存主要使用的DRAM方案性能提升速度远远慢于处理器速度,造成了阻碍性能提升的“内存墙”,直接在存储内做计算可有效解决。- 实现方法:1)改动存储模块电路:优势是容易和现有工艺进行集成,缺点是带来的性能提升有限;2)引入新的存储器件,实现在存储阵列内完成计算。号与数字表示形式进行相互转换,带来信号损耗、功率消耗和时延。- 实现方法:在Al芯片中使用模拟计算技术,将深度学习算法运算放在模拟域内完成,提高能效。SWIBai计算对大算力的需求。- 实现方法:完全新型的计算模式,理论模型为图灵机。从计算效率上,由于量子力学叠加性,配合量子力学演化的并行性,处理速度远超传统计算机,提供更强算力。2202.应用层应用概况:算力向边缘侧移动,逐渐专注于特殊场景的优化>随着技术成熟化,Al芯片的应用场景除了在云端及大数据中心,也会随着算力逐渐向边缘端移动,部署于智能家居、智能制造、智慧金融等领域;同时还将随着智能产品种类日渐丰富,部署于智能手机、安防摄像头、及自动驾驶汽车等智能终端,智能产品种类也日趋丰富。未来,Al计算将无处不在。亿欧智库:Al芯片应用领域云端训练可部署芯片:GPU/GPU/ASIC芯片特征:高吞吐量、高精 确率、可编程性、分布式、 可扩展性、高内存与带宽计算能力与功耗:>30TOPS, >50W应用:云/HPC/数据中心边缘计算终端设备云端推理- 可部署芯片:GPUGPUASIC/FPGA- 芯片特征:高吞吐量、高精 确率、分布式、可扩展性、 低延时- 计算能力与功耗:3OTOPS, >50W- 应用:云/HPC/数据中心可部署芯片:GPU/GPU/ASIC/FPGA芯片特征:降低Al计算延迟、可单独 部署或与其他设备组合(如5G基站)、 可将多个终端用户进行虚拟化、较小 的机架空间、扩展性及加速算法计算能力与功耗:530ToPS, 415W应用:智能制造、智慧家居、智慧交 通等、智慧金融等众多领域可部署芯片:GPU/GPU/ASIC/FPGA芯片特征:低功耗、高能效、推理任 务为主、较低的吞吐量、低延迟、成 木敏感计算能力与功耗:<8TOPS, <5W应用:各类消费电子,产品形态多 样;以及物联网领域24三广州修2堰馆系即A雄般J般於拱雨公用Fl你幽三里云端:当前仍是Al的中心,需更高性能计算芯片以满足市场需求当前,大多数AI训练和推理工作负载都发生在公共云和私有云中,云仍是Al的中心。在对隐私、网络安全和低延迟的需求推动下,云端出现了在网关、设备和传感器上执行Al训练和推理工作负载的现象,更高性能的计算芯片及新的Al学习架构将是解决这些问题的关键。A互联网是云端算力需求较旺盛产业,因此除传统芯片企业、芯片设计企业等参与者外,互联网公司纷纷入局Al芯片产业,投资或自研云端Al芯亿欧智库:云端Al芯片框架;-语音识别计算机视觉自然语言处理:;深度学习训练/推理:=SNTTensorFow:;Torch;;U1.!IIHB将凝强逑WCUDAOpenCLMMHU“cpu+加速硬件”GlU异构计算撷4W惊慝颂料仇卿翻I亿欧智库:2021中国人工智能算力投资行业分布65%15%;5%2%2%2%1%1%北联网政府金融制造服务电匕牧育医疗其他亿欧智库:中国云端Al芯片参与者芯片设计芯片代工IP设计互联网企业-百度阿里巴巴昆仑芯一代/二代芯片)含光NPUAl芯片/玄铁CPU飞桨平台无剑SOC平台字节跳动、腾讯、快手等也投资或孵化了芯片企业。25边缘侧:数据向边缘下沉,随着行业落地市场将有很大增量5G与物联网的发展以及各行业的智能化转型升级,带来了爆发式的数据增长。海量的数据将在边缘侧积累,建立在边缘的数据分析与处理将大幅度的提高效率、降低成本。随着大量的数据向边缘下沉,边缘计算将有更大的发展,IDC预测,未来,超过50%的数据需要在边缘侧进行储存、分析和计算,这就对边缘侧的算力提出了更高的要求。芯片作为实现计算能力的重要基础硬件,也将具备更多的发展。ABlReSearCh预测,2025年,边缘Al芯片市场将超过云端Al芯片。在人工智能算法的驱动下,边缘Al芯不但可以自主进行逻辑分析与计算,而且可以动态实时地自我优化,调整策略,典型的应用如黑灯工厂等。亿欧智库:边缘计算的价值:CROSS”C: COrmeCticm即联接海量设备。支持多个终端用户的虚拟化。R: ReaHime即业务的实时性。可以实现毫秒级的响应时间,支持实时服务。 0: OPtmiZation即数据的优化。在边缘积累数据,实现数据的感知和归一化。 S: Smart即应用的智能化。通过人工智能实现自我优化和策略调整等。S: SeCUrily即安全与隐私保护,数据本地化存储,有效保障用户隐私。物联网边缘计算广域接入网络边缘计算亿欧智库:边缘计算主要场景工业边缘计算边缘云智慧家庭/城市边缘计算多接入边缘计算26终端设备:终端产品类型逐渐多样,出货量增加催生大量芯片需求根据亿欧数据测算,中国自动驾驶行业规模增速在2022年将达到24%;智能摄像头产品出货量增速超15%;手机、平板、VR/AR眼镜等智能产品出货量也均有较大增速,催生出大量的智能芯片需求。智能驾驶智慧家居功能需求:图像识别、数据融合、 SLAM定位等、路径规划功能。算力要求:20-4000T0PS (L3-L5)功耗需求:中等,不过分追求低功耗 可靠性需求:高成本敏感性:低- 功能需求:图像识别、语义识别与理 解、语音助手等功能。- 以:力嬖求:ITOPS- 功耗需求:较高,家用小型产品多追 求更低功耗- 可靠性需求:较高- 成本敏感性:较高智慧安防 功能需求:图像/视频识别、图像/视 频检测等功能。 笫:力要求:4-20T0PS 功耗需求:追求较低低功耗 可靠性需求:偏高,尤其在识别的准 确性方面 成本敏感性:较高消费电子 功能点求:图像/场景识别、拍照美化、 语音助手等功能。 算力要求:1-8T0PS 功耗需求:追求低功耗来保证设备续 航时间 可靠性需求:高 成本敏感性:高27同时,智能终端产品种类也逐渐多样,智能音响、服务/商用机器人等消费硬件、工业/数控设备等工业产品以及通信产品等日渐丰富,不同产品类型也对芯片性能与成本提出更多的要求。03.典型企业酷芯微电子:高端智能视觉芯片领导者上海酷芯微电子有限公司,成立于2011年7月。公司依托智能越知、智能计算、智熊传输三大核心技术,通过自主研发芯片架构及核心IP,提供专用于人工智能的高性能芯片及解决方案。公司于2016年荣获高新技术企业,2017年被认定为上海科技小巨人,2019年入选上海市“专精特新”企业名单。目前公司有员工近200人,其中80%为技术开发人员。亿欧智库:酷芯微电子核心技术及主要产品高性