AMD与Google在AI领域将如何合作?

99ANYc3cd6 人工智能 6

这是一个 “硬件制造商”“全栈AI巨头” 之间的对决。

AMD与Google在AI领域将如何合作?-第1张图片-广州国自机器人
(图片来源网络,侵删)

核心定位与商业模式

AMD: 硬件巨头,AI计算的加速者

  • 核心业务: 设计和销售CPU、GPU、FPGA(现场可编程门阵列)等计算芯片。
  • AI战略: 提供强大的、开放的计算硬件平台,让AI开发者和企业能够在其硬件上高效地训练和推理AI模型,AMD不直接开发面向大众的AI应用,而是为这些应用提供“引擎”。
  • 商业模式: 硬件销售,通过销售其MI系列GPU Instinct加速器(用于数据中心)和Radeon系列GPU(用于消费级和专业市场)来盈利。
  • 优势:
    • 开放性: 不绑定特定的软件栈或云服务,客户可以自由选择在AMD硬件上运行各种AI框架(如PyTorch, TensorFlow)。
    • 高性能计算: 凭借其CPU和GPU在超算和高性能计算领域有深厚积累,这些技术可以平移到AI领域。
    • 性价比: 近年来,AMD的GPU在提供强大算力的同时,往往能提供比竞争对手更具吸引力的价格。

Google: 全栈AI巨头,从芯片到应用的生态构建者

  • 核心业务: 搜索、广告、云计算、安卓系统以及各种AI驱动的服务和产品(如Gmail, Google Maps, Google Translate)。
  • AI战略: 构建一个完整的、垂直整合的AI生态系统,从底层芯片、软件框架,到上层应用和服务,全部由Google自己掌控。
  • 商业模式: 多元化
    1. 云服务销售: 通过Google Cloud Platform提供其AI模型和基础设施服务,这是其AI商业化的重要途径。
    2. 软件即服务: 通过订阅等方式提供其先进的AI模型(如Gemini API)。
    3. 硬件销售: 出售其TPU芯片,但主要面向其云客户,不直接面向个人消费者。
  • 优势:
    • 全栈整合: 芯片、软件、模型、应用高度协同,可以实现极致的性能优化和能效比。
    • 海量数据与场景: 拥有全球最庞大的数据集和最丰富的AI应用场景,这为训练和验证世界一流的AI模型提供了无与伦比的优势。
    • AI先发优势: Google是深度学习领域的先驱,拥有TensorFlow、Keras等业界主流框架,以及顶级的AI研究团队(DeepMind, Google Brain)。

在AI领域的具体布局与产品

AMD: 专注硬件“肌肉”

  1. AI芯片 (GPU/加速器):

    • Instinct系列: 这是AMD在数据中心AI训练和推理领域的主力产品。
      • MI300X: 当前旗舰产品,采用CDNA 3架构,拥有高达192GB的HBMe内存,专门为训练和运行大型语言模型(如Llama)而优化,直接对标NVIDIA的H100。
      • MI300A: 整合了CPU和GPU,适合AI与高性能计算融合的工作负载。
    • Radeon系列: 面向消费者和专业市场,如RX 7900 XTX等,虽然也用于AI计算,但在专业数据中心领域不是主流。
  2. 软件与生态:

    • ROCm: 这是AMD的软件平台,类似于NVIDIA的CUDA,它允许开发者在AMD GPU上运行各种AI和高性能计算应用,AMD正在大力投入ROCm的开发和优化,以缩小与CUDA生态的差距。
    • 与AI框架合作: 与PyTorch, TensorFlow等主流框架保持紧密合作,确保其硬件能获得良好的支持。

Google: 从“大脑”到“神经”的全栈布局

  1. AI芯片 (TPU - Tensor Processing Unit):

    • TPU v4/v5e/v5: 这是Google的“秘密武器”,TPU是专为张量计算(即深度学习的核心运算)而设计的ASIC(专用集成电路),而不是通用GPU。
    • 优势: 在运行Google自己的AI模型(如Transformer架构)时,TPU的能效比和性能远超通用GPU,TPU v5是Google目前最先进的TPU,专为训练和运行大型模型而设计。
  2. AI软件框架与模型:

    AMD与Google在AI领域将如何合作?-第2张图片-广州国自机器人
    (图片来源网络,侵删)
    • TensorFlow: 全球最流行的开源机器学习框架之一,由Google主导开发。
    • JAX: 一个现代的、高性能的数值计算库,深受AI研究者喜爱,也是TensorFlow的底层基础。
    • Gemini: Google最新一代的、多模态的“大模型”,是其与OpenAI的GPT系列竞争的核心产品,它有Ultra, Pro, Nano等多个版本,覆盖从云端到手机端的各种场景。
  3. AI云服务:

    • Google Vertex AI: 一个统一的AI平台,提供从数据标注、模型训练、模型部署到模型监控的全套服务,企业可以轻松地在Google Cloud上使用Google最先进的AI模型(如Gemini)或训练自己的模型。
    • AI API: 开发者可以通过API调用Google的AI能力,如Gemini API、Vision AI、Natural Language AI等。
  4. AI应用:

    • Bard / Gemini Assistant: 对标ChatGPT的AI对话助手。
    • Google Search (SGE - Search Generative Experience): 在搜索结果中集成AI生成的摘要。
    • Google Photos: 用AI进行照片分类、修图、生成视频等。
    • DeepMind: AlphaGo, AlphaFold等震惊世界的AI成果的诞生地。

市场定位与竞争格局

特性 AMD Google
核心身份 硬件供应商 全栈AI巨头
主要战场 数据中心AI加速器市场 (挑战NVIDIA) 云AI服务市场 (挑战AWS, Azure)
关键产品 Instinct MI系列GPU TPU芯片, Gemini模型, Vertex AI平台
目标客户 云服务商 (如Microsoft Azure已采用), 企业, 超算中心 所有使用云服务的开发者和企业
核心竞争力 硬件性能、开放性、性价比 全栈整合能力、顶尖AI模型、海量数据
生态系统 ROCm + 开源AI框架 自研芯片 + 自研框架 + 自研模型 + 自研应用

总结与未来展望

  • AMD: 正在扮演AI时代“挑战者”的角色,它凭借其强大的芯片设计能力和开放策略,努力在由NVIDIA主导的AI硬件市场中撕开一个口子,它的成功与否,关键在于ROCm生态的成熟度能否持续提供性能领先且性价比高的硬件,如果AMD成功,将打破NVIDIA在AI硬件领域的垄断,为整个行业带来更多选择和更低的成本。

  • Google: 是AI领域的“定义者”和“领导者”之一,它的优势在于构建了一个从底层到上端的完整闭环,这使得它的AI技术能够快速、高效地应用到实际产品中,并形成强大的网络效应,Google的竞争焦点将更多地放在如何将Gemini等大模型商业化,并扩大其在云AI服务市场的份额

    AMD与Google在AI领域将如何合作?-第3张图片-广州国自机器人
    (图片来源网络,侵删)

一个重要的合作点: 值得注意的是,AMD和Google在某些领域是合作关系Microsoft Azure的云服务中,就同时使用了NVIDIA的GPU和AMD的MI系列GPU,为客户提供更多选择,Google Cloud也曾在其高性能计算虚拟机中提供AMD的GPU实例。

你不能简单地说AMD和Google谁在AI领域“更强”,因为它们处在产业链的不同位置。

  • 如果你想购买硬件来构建自己的AI集群,你会比较AMD的Instinct和NVIDIA的H100。
  • 如果你想使用云服务来快速开发或部署AI应用,你会比较Google Cloud的Vertex AI和AWS/Azure的AI服务。

AMD的成功将推动AI硬件的普及和成本下降,而Google的成功则将推动AI应用的创新和商业化,两者都在以不同的方式推动着人工智能向前发展。

标签: AMD Google AI芯片合作 AMD Google人工智能联合开发 AMD Google AI生态共建

抱歉,评论功能暂时关闭!