昇腾910是华为昇腾系列AI处理器中的旗舰产品,也是华为在AI硬件领域技术实力的集中体现,它于2025年正式发布,当时的目标就是要在算力上超越英伟达的顶级GPU,成为全球最强的AI训练芯片之一。

核心定位与目标
昇腾910的核心定位是 面向AI训练 的高端AI处理器,与主要用于推理(Inference)的芯片不同,训练芯片需要处理海量的数据和模型参数,进行反复的迭代计算,因此对 算力、内存带宽和能效比 提出了极高的要求。
华为发布昇腾910的明确目标是:打造全球算力最强的单芯片AI训练产品,打破国外在高端AI芯片领域的垄断,为中国乃至全球的AI产业提供强大的算力底座。
关键技术特性
昇腾910的设计融合了多种先进技术,其核心亮点包括:
达芬奇架构
这是昇腾芯片的灵魂,华为自研的“达芬奇架构”专门为AI计算优化,它不同于传统的CPU或GPU架构。

- AI Core单元:每个AI Core内部包含3个关键计算单元:
- 3D Cube计算单元:专门用于矩阵乘法和卷积运算,这是深度学习中最核心、最耗时的计算,其性能远超传统浮点运算单元。
- Vector计算单元:处理向量和标量运算,负责通用计算。
- Scalar计算单元:负责控制和标量计算。
- 统一计算:这种架构设计实现了AI计算和通用计算的融合,使得芯片不仅能高效训练模型,也能胜任一些推理和通用计算任务,提高了芯片的利用率。
极致的算力
昇腾910在发布时,其算力指标非常惊人,是它最引以为傲的地方。
- 半精度(FP16)算力:256 TFLOPS(每秒256万亿次半精度浮点运算)。
- 整数精度(INT8)算力:512 TOPS(每秒512万亿次整数运算)。
- 对标:在发布时,这个FP16算力指标超越了当时英伟达旗舰GPU(如V100)的理论峰值算力,实现了华为“算力第一”的目标。
高内存带宽
AI训练需要从内存中快速读取海量数据,内存带宽是决定性能的关键瓶颈之一。
- HBM2e高带宽内存:昇腾910采用了当时最先进的HBM2e高带宽内存技术。
- 带宽高达1.2 TB/s:这个带宽值确保了AI Core能够“喂饱”自己,不至于因为数据供应不足而“断粮”,从而充分发挥其强大的计算能力。
高速互联
在大型AI模型训练中,单块芯片的算力往往不够,需要将成百上千块芯片连接起来,形成一个巨大的计算集群。
- HCCS(Huawei Cache Coherency System)高速互联接口:华为自研的高速互联技术。
- 互联带宽:单端口带宽可达数百GB/s,支持多个芯片间高效、低延迟的数据交换,构建强大的AI计算集群。
软硬件协同优化
华为的强大之处在于其“软硬协同”的战略,昇腾910的强大算力需要通过高效的软件栈才能被开发者方便地使用。

- CANN(Compute Architecture for Neural Networks):这是华为的全栈计算平台,是连接芯片与应用的桥梁。
- 底层驱动:直接控制硬件。
- 运行时:任务调度和资源管理。
- 图编译器:将主流AI框架(如TensorFlow, PyTorch)的计算图进行优化,转换成昇腾芯片能高效执行的指令。
- 工具链:提供调试、性能分析等工具。
- MindSpore(昇思):华为自研的全场景AI框架,从设计之初就深度适配昇腾硬件,可以实现“AI for AI”的自动优化,进一步提升训练效率。
实际表现与意义
- 性能验证:2025年,华为在ResNet-50、BERT等业界主流AI模型的训练任务中,使用昇腾910集群的性能表现优于当时的英伟达方案,证实了其强大的算力实力。
- 战略意义:
- 技术突破:证明了华为有能力设计出世界顶级的AI芯片,打破了“只有美国能造高端AI芯片”的神话。
- 产业自主:为中国的AI产业提供了不依赖于国外技术的算力选择,对于保障国家AI战略安全至关重要。
- 生态构建:以昇腾910和MindSpore为核心,华为开始构建自己的AI软硬件生态,试图打造一个与NVIDIA CUDA体系相抗衡的“昇腾生态”。
面临的挑战与现状
尽管昇腾910在技术上取得了巨大成功,但它的商业化之路也面临着巨大挑战,尤其是在美国持续的技术制裁背景下。
- 生态系统差距:NVIDIA的CUDA生态系统经过十多年的发展,拥有全球最庞大、最成熟的开发者社区、最丰富的库和工具,开发者习惯、教学资料、开源项目都围绕CUDA构建,昇腾生态虽然发展迅速,但在生态成熟度和用户习惯上仍有巨大差距。
- 软件迁移成本:将一个基于NVIDIA平台开发的AI模型和应用迁移到昇腾平台上,需要修改代码、重新编译和调优,这个过程对很多企业和开发者来说成本高昂。
- 制裁影响:美国多次升级对华为的制裁,严重影响了昇腾芯片的生产和供应链,虽然华为通过国内供应链(如中芯国际)进行代工,但在先进制程的获取上依然受限,这可能影响其未来的产品迭代和成本控制。
华为昇腾910是一款技术实力极其强大的AI训练芯片,它代表了华为在高端芯片设计上的顶尖水平,它以自研的达芬奇架构和极致的算力为目标,成功实现了技术上的突破,为中国AI产业提供了宝贵的算力底座。
一款芯片的成功不仅取决于硬件性能,更取决于其生态系统的成熟度和市场接受度,在当前复杂的国际环境下,昇腾910及其生态正在经历一场艰难的“攻坚战”,既要面对NVIDIA的生态壁垒,又要应对外部供应链的压力,它的故事,是技术实力与商业现实激烈碰撞的缩影。
标签: 华为910 AI芯片性能评测 华为昇腾910算力参数 华为910芯片与英伟达对比