按应用场景划分(最常见的分类方式)
这是最直观的分类方法,根据芯片主要服务的领域来划分。

云端/数据中心 AI 芯片
这类芯片专为数据中心设计,用于大规模的AI模型训练、推理以及云服务,它们追求极致的计算性能、高能效比和可扩展性。
-
英伟达 - GPU (图形处理器)
- 代表产品: A100, H100, H200, B200 (Blackwell架构)
- 特点: AI领域的“绝对霸主”,其CUDA生态系统是最大的护城河,拥有最成熟的软件栈和开发者社区,Tensor Core专门为矩阵运算优化,是AI训练和推理的事实标准,H100是目前性能最强的AI芯片之一,集成了Transformer引擎,专为大型语言模型优化。
- 地位: 训练市场的领导者,在推理市场也占据重要份额。
-
谷歌 - TPU (张量处理单元)
- 代表产品: TPU v4 Pod, TPU v5e
- 特点: 专为谷歌自己的AI工作负载(如TensorFlow)而设计,与谷歌云深度绑定,在特定AI任务(尤其是训练)上能提供极高的性能和能效比,TPU v5e则针对大模型推理进行了优化。
- 地位: 训练市场的重要挑战者,在谷歌内部和云服务上表现优异。
-
AMD - GPU (图形处理器)
(图片来源网络,侵删)- 代表产品: MI300X (Ampere架构)
- 特点: 英伟达最主要的竞争对手,MI300X是业内首个支持HBM3显存的服务器GPU,显存容量和带宽巨大,非常适合训练超大规模语言模型,其ROCm生态系统正在快速发展,试图挑战CUDA。
- 地位: 训练市场的强力挑战者,特别是在大模型训练领域。
-
英特尔 - GPU (GPU/FPGA/ASIC)
- 代表产品: Gaudi系列 (Gaudi 2, Gaudi 3), Habana Gaudi
- 特点: 英特尔通过收购Habana Labs进入AI芯片市场,Gaudi系列是自研的AI训练ASIC,主打高性价比和能效比,直接对标英伟达的A100/H100。
- 地位: 训练市场的追赶者。
-
国产云端AI芯片
- 华为 - 昇腾
- 代表产品: 昇腾910B (训练), 昇腾310 (推理)
- 特点: 自主研发的AI处理器,采用“达芬奇”架构,与昇思MindSpore深度集成,构建完整的国产AI生态,昇腾910B在性能上已接近英伟A100,是国内AI训练的主力芯片。
- 寒武纪
- 代表产品: 思元系列 (思元590, 思元370)
- 特点: 国内AI芯片的“独角兽”,思元590是其云端训练芯片,对标英伟达A100;思元370是云端推理芯片,产品线覆盖训练和推理。
- 壁仞科技
- 代表产品: BR100系列
- 特点: 曾是国内首个发布性能对标英伟达A100的通用GPU的公司,采用Chiplet(芯粒)技术,性能强大。
- 摩尔线程
- 代表产品: MTT S系列
- 特点: 专注于图形和AI计算,其MTT S80/S3000等产品定位云端推理,支持主流图形API和AI框架。
- 华为 - 昇腾
边缘/终端 AI 芯片
这类芯片集成在手机、摄像头、汽车、机器人等设备中,要求低功耗、小尺寸、低成本,并能实时处理AI任务。
-
高通 - SoC (片上系统)
(图片来源网络,侵删)- 代表产品: 骁龙8 Gen系列 (手机), 骁龙Ride (汽车)
- 特点: 凭借在手机市场的绝对优势,其集成的AI引擎(Hexagon NPU)成为移动端AI的事实标准,在手机拍照、语音助手、人脸识别等方面应用广泛,其汽车芯片也支持高级辅助驾驶。
- 地位: 移动端AI芯片的领导者。
-
苹果 - SoC
- 代表产品: A系列/M系列芯片
- 特点: 极致的性能和能效比,其自研的Neural Engine神经网络引擎是移动端AI性能的标杆,在iPhone上的面容ID、Live Text、Siri等AI功能体验流畅。
- 地位: 移动端AI芯片的领导者,尤其在端侧AI体验上。
-
联发科 - SoC
- 代表产品: 天玑系列
- 特点: 高性能的AI处理器(APU),在中高端手机市场占有率高,为手机提供强大的本地AI计算能力。
-
华为 - SoC
- 代表产品: 麒麟系列
- 特点: 集成的NPU(达芬奇架构)是其一大特色,在图像处理、自然语言处理等AI任务上表现出色,尤其是在受限环境下依然能提供强大的算力。
-
安防/物联网芯片
- 海思 - SoC
- 代表产品: 昇腾系列
- 特点: 在安防监控领域占据主导地位,其芯片集强大的NPU,用于实时视频分析、人脸识别、行为检测等。
- 地平线
- 代表产品: 旭日系列 (边缘计算), 征程系列 (智能驾驶)
- 特点: 国内领先的AI芯片公司,专注于边缘计算和智能驾驶,其芯片和算法方案一体化,在智能摄像头、智能座舱等领域有广泛应用。
- 瑞芯微
- 代表产品: RK3588
- 特点: 在嵌入式和边缘计算市场占有率高,其NPU性能强劲,被广泛应用于智能盒子、工业视觉、机器人等领域。
- 海思 - SoC
汽车AI芯片
这是一个特殊且高要求的边缘计算领域,对功能安全、可靠性和算力有极高要求。
-
英伟达 - SoC
- 代表产品: Thor (雷神), Orin (奥利安)
- 特点: 汽车AI芯片的领导者,Orin是目前量产车型中最主流的芯片,而Thor(单2000 TOPS)则定义了下一代智能驾驶算力的天花板,其Drive OS平台提供完整的软件栈。
- 地位: 智能驾驶芯片的领导者。
-
高通 - SoC
- 代表产品: 骁龙Ride Flex, Snapdragon Ride Vision
- 特点: 从座舱芯片扩展到智能驾驶领域,提供“舱驾一体”的解决方案,在座舱娱乐和智能驾驶领域均有布局。
-
地平线
- 代表产品: 征程系列
- 特点: 国内智能驾驶芯片的领导者,征程5芯片已用于多款量产车型,提供开放平台和算法方案,是国内车企的重要选择。
-
黑芝麻智能
- 代表产品: 华山系列
- 特点: 另一家国内领先的汽车芯片公司,华山二号A1000芯片算力高达128 TOPS,已获得多家车企的定点订单。
-
Mobileye
- 代表产品: EyeQ系列
- 特点: 曾是ADAS领域的绝对霸主,提供“芯片+算法+数据”的交钥匙方案,虽然市场份额受到挑战,但在传统ADAS市场依然根基深厚。
按架构划分(技术分类)
从技术实现的角度看,AI芯片主要有以下几种架构:
-
GPU (图形处理器)
- 特点: 拥有数千个计算核心,擅长大规模并行计算,其核心的矩阵运算能力恰好匹配AI模型的计算需求,是目前AI计算的主力。
-
ASIC (专用集成电路)
- 特点: 为特定AI算法或任务量身定制的芯片,性能和能效比极高,但缺乏灵活性,谷歌的TPU、华为的昇腾910B、寒武纪的思元590等。
-
FPGA (现场可编程门阵列)
- 特点: 硬件可编程,灵活性极高,适合AI算法的快速迭代和原型验证,在部分推理场景和特定计算任务中仍有应用,但成本较高,大规模部署不如ASIC和GPU。
-
CPU (中央处理器)
- 特点: 通用性强,但处理AI任务的并行计算能力远不如GPU,通常用于轻量级的AI推理任务或作为系统的控制核心。
总结表格
| 应用场景 | 主要玩家 | 代表产品 | 特点与地位 |
|---|---|---|---|
| 云端/数据中心 | 英伟达 | A100, H100, H200 | 训练市场霸主,CUDA生态无敌,性能最强。 |
| 谷歌 | TPU v4/v5e | 训练市场重要挑战者,与谷歌云深度绑定,能效比高。 | |
| AMD | MI300X | 训练市场强力挑战者,显存优势明显,ROCm生态发展中。 | |
| 华为 | 昇腾910B | 国产训练主力,性能对标A100,自主生态。 | |
| 寒武纪 | 思元590 | 国内AI芯片独角兽,产品线覆盖训练和推理。 | |
| 边缘/终端 | 高通 | 骁龙8系列 | 移动端领导者,手机AI市场主导。 |
| 苹果 | A/M系列 | 移动端领导者,能效比标杆,端侧AI体验好。 | |
| 地平线 | 旭日/征程 | 国内边缘计算和智能驾驶领先者,软硬结合。 | |
| 海思 | 昇腾系列 | 安防市场主导者,视频AI分析能力强。 | |
| 汽车AI | 英伟达 | Thor, Orin | 智能驾驶领导者,算力天花板,软件栈完善。 |
| 高通 | 骁龙Ride | 提供“舱驾一体”方案,从座舱扩展到驾驶。 | |
| 地平线 | 征程系列 | 国内智能驾驶领导者,已获多款车型定点。 | |
| 黑芝麻智能 | 华山系列 | 国内汽车芯片新锐,专注高算力智能驾驶。 |
AI芯片市场呈现出“云端GPU一家独大,ASIC和FPGA各有所长;边缘端SoC竞争激烈,国产芯片快速崛起”的格局,英伟达在云端的主导地位短期内难以撼动,但在边缘端和汽车领域,高通、苹果以及地平线、华为等国内外厂商正在激烈竞争,共同推动着人工智能技术的落地。
标签: 人工智能芯片类型有哪些 AI芯片常见分类 人工智能芯片种类详解