股票行情|中国AI芯片企业的追击

来源:国泰君安证券研究

ASIC方向发展机遇较大

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油

随着AI 进入“大模型”时代，训练数据不断增长、算法复杂度不断提高，国内人工智能厂商对算力的需求陡升。AI芯片作为大模型及AI应用落地的算力基础，重要性日益凸显。

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油

广义的AI芯片指专门用于处理人工智能应用中大量计算任务的模块，即面向人工智能领域的芯片均被称为AI芯片。狭义的AI芯片即针对人工智能算法做了特殊加速设计的芯片。狭义的AI芯片与传统芯片（如CPU）相比，性能优势主要体现在专用性的侧重上。

AI芯片主要分为三种类型：通用型（GPU）、半定制型（FPGA）、定制型（ASIC）。三类芯片代表分别有英伟达（NVIDIA）的GPU、赛灵思的FPGA和Google的TPU。GPU的计算能力最强，但是成本高、功耗高；FPGA可编程，最灵活，但是计算能力不强；ASIC体积小、功耗低，适合量产，但是研发时间长，且不可编辑，前期投入成本高，带来一定的技术风险。

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油2

针对不同技术路径，国内厂商均已有所布局。

Ø GPU：国内GPU厂商已有部分产品落地，国产GPU迎来黄金发展期。相比英伟达和AMD，国内GPsU厂商的营收规模较小。但是国产GPU正受益于信创的机遇，在数据中心、智能汽车、游戏等应用领域的国产GPU需求量也极大提升，国产 GPU正在迎来黄金发展期。目前景嘉微已成功研发JM7200和JM9系列GPU芯片，应用于台式机、笔记本、服务器、自助终端等设备。海光信息的DCU也属于GPGPU的一种，其DCU协处理器全面兼容“类 CUDA”环境，主要部署在服务器集群或数据中心。

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油3

Ø CPU+FPGA：国内巨头纷纷布局CPU+FPGA的混合异构加速AI计算。FPGA芯片用于加速AI计算时可以实现灵活部署，具备可编程性、高并行性、低延迟、低功耗等特点，在AI推断领域潜力巨大。全球科技巨头纷纷布局云端FPGA生态，国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务，百度大脑也使用了FPGA芯片。此前被全球最大FPGA厂商赛灵思收购的深鉴科技也是基于FPGA来设计深度学习的加速器架构。

Ø ASIC：国内ASIC厂商实力雄厚，积极追赶国外芯片巨头。ASIC作为专用集成电路，广泛应用于人工智能设备等领域，根据终端功能可细分为TPU芯片、DPU芯片和NPU芯片等。最具代表性的就是谷歌2015年推出的首款TPU，大幅提升AI推理的性能。经过近年来国内ASIC厂商的快速发展，在工艺、算力、整体性能等方面，均达到国际领先水平。海思的昇腾910在BF16浮点算力方面超越谷歌最新一代产品TPUv4，遂原科技的云燧T20和寒武纪的NPU在整体性能上也与谷歌比肩。未来国内头部ASIC厂商有望继续保持技术优势，突破国外厂商在AI芯片的垄断格局。

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油5

实现专用算法“硬件优化”，ASIC路线在AI领域的长期成长性值得期待。ASIC虽然无法重新编程，且前期投入成本较高，但是在大规模量产的情况下，ASIC具备性能更强、体积更小、功耗更低、成本更低、可靠性更髙等优点。随着人工智能技术发展成熟、算法逐渐收敛，ASIC将更具备一定竞争优势。

1、 AIGC拉动AI算力需求，AI芯片将成为未来科技石油6

2、国内AI芯片企业蓬勃发展

在政策和需求的双重促进下，中国AI芯片厂商奋起直追，尤其在ASIC方向发展机遇较大。整体上看，国外芯片巨头目前仍处于领先地位，占据了大部分市场份额，并且在GPU和FPGA方面近乎垄断。但国内AI芯片厂商在政策和需求的双重拉动下奋起直追，华为海思、地平线、寒武纪、海光信息、昆仑芯等厂商在多个领域取得突破进展。尤其在ASIC 路线下，国内厂商有机会实现快速抢占市场。

2、国内AI芯片企业蓬勃发展

国内AI芯片企业百花齐放

寒武纪：AI芯片独角兽，中国ASIC路线先行者。寒武纪成立于2016年，是全球AI芯片领域第一个独角兽初创公司，研发团队成员主要来自于中科院，董事长陈天石曾任中科院计算所研究员。

国内AI芯片企业百花齐放

作为AI芯片领域的独角兽，寒武纪曾与华为携手打造全球首款手机AI芯片，近年来通过专注打造云端产品线构建技术壁垒。

Ø 云端：AI芯片寒武纪近年来不断推出面向云端的AI芯片，思元290是寒武纪首款面向云端训练的智能芯片，思元370面向云端且实现训推一体，这两款芯片均采用7nm制程工艺。此外，思元370是寒武纪首款采用Chiplet技术的AI芯片，寒武纪第二代云端推理产品思元270算力的2倍。

Ø 终端：2016年，寒武纪发布了全球首款终端AI处理器、首款商用NPU“寒武纪1A”，面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备，主流智能算法能耗比全面超越传统CPU、GPU。寒武纪1A被应用于全球首款智能手机AI芯片——麒麟970。

国内AI芯片企业百花齐放6

华为海思：昇腾代表业界最强AI算力。思半导体成立于2004年10月，是华为的全资子公司。得益于母公司的强势全力支持和持续的高研发投入，海思已成为全球领先的Fabless半导体公司，产品覆盖智慧视觉、AIoT、智慧媒体、智慧交通及汽车电子、显示、手机终端、数据中心及光收发器等多个领域。

昇腾系列——面向“端、边、云”全栈全场景AI芯片，代表着业界最强AI算力，采用华为自研的达芬奇架构，对标国际巨头谷歌英伟达。2018年，华为提出了全栈全场景AI解决方案并发布了两款AI芯片，昇腾910和昇腾310，其计算核心采用华为自研的面向AI计算特征的“达芬奇架构”。昇腾910是单芯片计算密度最大的芯片，对标英伟达V100和谷歌TPUv3，比V100的标称算力125TOPS高出约一倍，而昇腾310芯片的最大功耗仅8W，是极致高效计算低功耗AI芯片。基于昇腾系列AI处理器，华为推出Atlas全系列、全息感知产品，覆盖端侧、边缘侧和数据中心侧。

地平线：国内车载芯片领头羊。地平线成立于2015年，是一家注重软硬件结合的AI创业公司，致力于开发边缘AI芯片及相关解决方案，由Intel、嘉实资本、高瓴资本领投。

提出嵌入式AI芯片架构BPU，坚持“芯片+算法+工具链”完整解决方案。2017年12月，地平线自主设计研发了中国首款嵌入式人工智能视觉芯片——旭日系列和征程系列，基于自研BPU架构，通过软硬结合打造极致性能。目前，地平线是业界唯一能够提供覆盖从L2到L4全场景整车智能芯片方案的人工智能平台型企业。

海光信息：国产CPU+DCU龙头，性能达国际化可比水平。光信息成立于2014年，公司骨干研发人员多拥有国内外知名芯片公司的就职背景，拥有成功研发x86处理器或ARM处理器的经验。

CPU+DCU双轮驱动，实现领先的处理器性能。海光信息的产品包括海光通用处理器（CPU）和海光协处理器（DCU）。海光 DCU 系列产品以基于通用的GPGPU架构，采用7nm工艺，兼容“类 CUDA”环境以及国际主流商业计算软件和人工智能软件，软硬件生态丰富。目前海光DCU系列产品深算一号已经实现商业化应用，于2021年实现规模化出货，未来将广泛应用于大数据处理、人工智能、商业计算等领域，其产品性能达到了国际上同类型主流高端处理器的水平，具有较强的并行计算能力和较高的能效比，在国内处于领先地位。

AI芯片乃兵家必争之地，BAT均已有所布局

对于互联网大厂来说，腾讯、百度、阿里巴巴等均在AI芯片领域大力布局。其中，腾讯投资燧原科技、百度投资昆仑芯、阿里巴巴则孵化了平头哥。除此之外，原AMD全球GPGPU设计总负责人陈维良成立了沐曦集成电路，两位CTO均为前AMD首席科学家；原AMD首席工程师郑金山成立了天数智芯，首席技术官曾任三星全球副总裁；原商汤科技总裁张文成立了壁仞科技，CTO曾任职于海思的GPU自研团队。

燧原科技（腾讯系）：燧原科技成立于2018年，公司创始人赵立东曾任紫光通信科技集团有限公司副总裁、AMD计算事业部高级总监；COO张亚林曾任AMD资深芯片经理、技术总监。

邃思2.0是迄今中国最大的AI计算芯片。公司成立以来，已相继推出云端AI训练芯片邃思1.0/2.0、云端AI训练加速卡云燧T1x/T2x和AI推理加速卡云燧i1x/i2x，以及配套的“驭算”软件编程平台TopsRider和“鉴算”推理加速引擎TopsInference。公司2021年在世界人工智能大会期间发布的邃思2.0是迄今中国最大的AI计算芯片。

自研软硬件协同架构设计，灵活通用高效开发。燧原芯片架构采用“GCU-CARA”(通用计算单元和全域计算架构)，是分别基于硬件的通用计算单元GCU和基于软件的驭算TopsRider两个主要品牌，具备完全可编程、全模式计算、全精度计算、高并行度等特点。其软件编程平台驭算TopsRider和推理加速引擎鉴算Topsinference可支持 TensorFlow、PyTorch、ONNX 等主流模型框架。

昆仑芯（百度系）：昆仑芯成立于2011年，前身为百度智能芯片及架构部，于2021年4月完成独立融资。公司团队成员多数成员来自百度、高通、Marvell、Tesla等行业头部公司，22年完成A轮融资。

百度基于自研XPU架构，致力打造通用AI芯片，赋能互联网、工业制造、智慧金融、智慧交通等多个领域。百度从2011年开始就基于FPGA实现AI加速公司于2018年正式开始AI芯片研发并在2020年实现昆仑芯1代芯片大规模部署，2021年8月昆仑芯2代产品实现量产。昆仑芯采用自研的面向通用AI的XPU架构，其第二代昆仑芯产品采用7nm制程，相比1代产品性能提升2-3倍，FP16算力达到128TFLOPS，主要为数据中心高性能计算提供算力支持。同时，昆仑芯深度适配PaddlePaddle（飞桨），也支持 PyTorch、TensorFlow、ONNX等主流的深度学习框架。

平头哥（阿里系）：平头哥成立于2018年，由阿里全资收购的中天微与达摩院芯片研发团队合并而来，公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。

作为拥有国内公有云市场最大份额的企业，阿里自研AI芯片投入最多、决心极大，致力于云端一体化芯片和AIoT芯片产品。公司有两条研发主线，分别聚焦于云计算和嵌入式两类芯片：

Ø 利用ARM的IP为阿里云数据中心研发芯片，在云端提供普惠算力，即倚天系列和含光系列；

Ø 基于RISC-V处理器架构进行研发，如玄铁系列，主要应用是在AIoT领域。

含光800专用于云端视觉处理。2019年平头哥在云栖大会上发布AI推理芯片含光800，为TSMC12nm工艺制程，采用平头哥自研架构和达摩院算法，算力相当于10个GPU，性能峰值算力达820 TOPS。含光800 AI芯片专用于云端视觉处理，可在视觉图像识别/分类/搜索、医疗影像、城市监控等领域发挥作用。为了实现软硬件协同，平头哥提供了HGAI软件开发包，可支持主流开源框架 TensorFlow、Caffe、MXNet 和ONNX，广泛适用于语音、图片、视频等AI推理业务。

虽然BAT均已布局AI芯片，但具体路径也各有特色。百度选择了拆分芯片业务，阿里的云端高性能芯片自用，RISC-V芯片开源开放，腾讯主要以投资的方式，用尽可能少的投入撬动自研芯片。除AI芯片本身的硬件之外，与之配套的软件开发体系亦是生态的重要组成部分，包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等。由于全球主流深度学习框架均使用CUDA平台，因此国内AI芯片厂商在生态构建的初期均需兼容CUDA，但是长期国产AI芯片厂商仍需构筑自身软硬件生态。

注：本文来自国泰君安发布的《中国AI芯片企业的追击（深度）》，报告分析师：李沐华、齐佳宏

本订阅号不是国泰君安证券研究报告发布平台。本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告，如需了解详细的证券研究信息，请具体参见国泰君安证券研究所发布的完整报告。本订阅号推送的信息仅限完整报告发布当日有效，发布日后推送的信息受限于相关因素的更新而不再准确或者失效的，本订阅号不承担更新推送信息或另行通知义务，后续更新信息以国泰君安证券研究所正式发布的研究报告为准。

本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制，根据《证券期货投资者适当性管理办法》的要求，若您并非国泰君安证券研究服务签约客户，为控制投资风险，还请取消关注，请勿订阅、接收或使用本订阅号中的任何信息。如有不便，敬请谅解。

市场有风险，投资需谨慎。在任何情况下，本订阅号中信息或所表述的意见均不构成对任何人的投资建议。在决定投资前，如有需要，投资者务必向专业人士咨询并谨慎决策。国泰君安证券及本订阅号运营团队不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅为国泰君安证券所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用，如因侵权行为给国泰君安证券研究所造成任何直接或间接的损失，国泰君安证券研究所保留追究一切法律责任的权利。更多股票资讯，关注财经365！

标签：股票股票行情个股分析