百度是国内最早布局 AI 并开放能力的企业之一,其 AI 开放平台(现整合在 百度智能云 Baidu Cloud 下)提供了非常丰富且强大的 API 服务,覆盖了从基础的自然语言处理、计算机视觉到行业解决方案的方方面面。

对于开发者来说,使用百度的 AI API 主要分为以下几步:
- 注册与创建应用:获取 API Key 和 Secret Key。
- 选择并调用 API:根据需求选择合适的 API,通过 HTTP 请求调用。
- 处理返回结果:解析 API 返回的 JSON 数据。
下面我将为你梳理主要的服务类别、核心 API、以及如何开始使用。
核心 AI 服务与主要 API
百度的 AI API 主要集中在以下几个领域:
自然语言处理
这是百度的王牌领域,尤其以 文心一言 和 ERNIE(文心大模型) 为核心,提供了从通用到专业的全系列 NLP 能力。

-
文心大模型 API:
- 功能:这是目前最核心、最强大的能力,支持文本创作、语言理解、逻辑推理、代码生成、多模态理解等。
- 主要 API:
ernie-bot/ernie-bot-turbo/ernie-bot-4.0:不同版本的对话模型 API,用于构建聊天机器人、智能问答等。embedding-v1:文本向量 API,将文本转换成高维向量,用于语义搜索、聚类、推荐等。aistudio:文心大模型定制与服务平台 API,用于 Fine-tuning(微调)专属模型。
- 特点:理解能力强、生成内容质量高、支持长文本、支持多轮对话。
-
传统 NLP API:
- 自然语言处理:提供了一系列细粒度的工具 API。
- 词法分析:分词、词性标注、命名实体识别。
- 句法分析:依存句法分析、成分句法分析。
- 文本分类:情感分析、新闻分类、意图识别等。
- 信息抽取:关键词提取、实体关系抽取。
- 机器翻译:支持多种语言之间的互译。
- 语音合成:将文本转换为自然流畅的语音。
- 语音识别:将语音转换为文字。
- 自然语言处理:提供了一系列细粒度的工具 API。
计算机视觉
提供图像和视频相关的分析、识别、生成能力。
-
图像识别:
(图片来源网络,侵删)- 通用物体和场景识别:识别图片中的物体、场景。
- 图像标签:为图片打上多维度标签。
- 人脸识别:人脸检测、人脸关键点定位、人脸属性分析(年龄、性别、颜值等)、人脸搜索、1:1 人脸验证、1:N 人脸比对。
- OCR(文字识别):
- 通用文字识别:识别图片中的印刷体和手写体文字。
- 文档结构化识别:识别身份证、银行卡、驾驶证、行驶证、表格、票据等,并提取结构化信息。
- 手写文字识别:专门识别手写内容。
- 图像生成:
- 文生图:输入文本描述,生成高质量图片(基于文心大模型的文心一格能力)。
- 图生图:以参考图为条件,生成新的图片。
- 图像修复:修复图片中的破损区域。
-
视频理解:
- 分析:识别视频中的物体、场景、行为。
- 视频封面:智能推荐视频的最佳封面图。
- 视频字幕:为视频生成字幕。
智能语音
专注于语音交互技术。
- 语音技术:
- 语音识别:支持多种场景和方言的语音转文字。
- 语音合成:支持多种音色、情感和语速的 TTS,可定制声音。
- 语音唤醒:在设备待机时,通过特定唤醒词激活。
- 实时语音识别:流式处理音频,低延迟,适用于会议、直播等场景。
- 语音唤醒:让设备在待机状态下被特定词语唤醒。
AI Studio 与行业解决方案
- AI Studio:百度的 AI 开发者社区和一站式开发平台,你可以在上面:
- 免费使用 GPU 算力训练和部署模型。
- 参与官方组织的 AI 竞赛。
- 调用和管理你的 API。
- 获取学习笔记和代码示例。
- 行业解决方案:百度还提供了针对特定行业的解决方案,如智慧城市、智慧金融、智能客服、媒体内容理解等,这些通常是基于上述 API 组合而成的更高级的服务。
如何开始使用百度 AI API(新手指南)
步骤 1:注册与登录
- 访问 百度智能云官网。
- 点击右上角“登录/注册”,使用百度账号登录。
- 完成实名认证,这是使用大部分付费 API 的必要步骤。
步骤 2:创建应用并获取 AK/SK
- 登录后,进入 控制台。
- 在左侧导航栏找到 “产品服务” -> “人工智能”,选择你感兴趣的服务(自然语言处理”)。
- 进入服务页面后,找到并点击 “创建应用”。
- 填写应用名称(如“我的第一个AI应用”),选择应用类型(一般选择“公开”)。
- 创建成功后,你将获得该应用的 API Key (AK) 和 Secret Key (SK)。
- AK:用于标识你的应用。
- SK:用于生成签名,验证你的身份,请务必妥善保管,不要泄露。
步骤 3:调用 API(以文心大模型 API 为例)
调用百度 API 通常需要签名认证,过程如下:
-
获取 Access Token (AT):使用你的 AK 和 SK,通过特定的接口换取一个有时效性的 Access Token,这个 Token 在后续所有 API 调用中都需要携带。
- 请求地址:
https://aip.baidubce.com/oauth/2.0/token - 请求方法:
POST - 参数:
grant_type=client_credentials&client_id=YOUR_AK&client_secret=YOUR_SK
- 请求地址:
-
构造并发送 API 请求:使用获取到的 AT,调用具体的 API 接口。
- 以
ernie-bot-turbo为例: - 请求地址:
https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/ernie-bot-turbo - 请求方法:
POST - 请求头:
Content-Type: application/json - 请求体(JSON):
{ "messages": [ {"role": "user", "content": "你好,请介绍一下你自己。"} ] } - 注意:请求地址中的
YOUR_ACCESS_TOKEN需要替换成第一步获取到的 AT。
- 以
-
处理响应:API 会返回一个 JSON 格式的结果,包含模型的回复。
{ "id": "as-xxxxxxxxxxxxxxxx", "object": "chat.completion", "created": 1678887889, "result": "你好,我是文心一言,由百度公司开发的大语言模型...", "is_truncated": false, "need_clear_history": false }
步骤 4:查看用量与费用
- 在控制台的 “费用中心” -> “费用中心” -> “费用概览” 可以查看你的账户余额。
- 在对应服务的 “调用统计” 页面,可以查看 API 的调用量、用量趋势等。
- 百度通常提供免费额度,超出后按量计费,具体价格可以在每个服务的“价格详情”页面查看。
资源与支持
- 官方文档:百度智能云 AI 文档中心,这是最重要的资源,包含了所有 API 的详细说明、调用示例和错误码。
- AI Studio:https://aistudio.baidu.com/,提供大量 Jupyter Notebook 示例、免费算力和社区讨论。
- SDK:百度官方提供了多种语言的 SDK(如 Python, Java, Go, PHP),可以大大简化签名和调用的过程,强烈推荐使用,你可以在官方文档中找到各语言的 SDK 下载和安装指南。
百度的 AI API 生态系统非常成熟,特别是其基于 文心大模型 的服务,在能力和易用性上都处于国内领先地位,无论你是想开发一个简单的聊天机器人,还是构建复杂的行业解决方案,百度智能云都能提供从底层技术到上层应用的全套支持。
对于开发者而言,建议从 AI Studio 入手,利用其丰富的示例和免费资源,快速上手并体验百度的 AI 能力。
标签: 百度AI API快速接入教程 人工智能API应用接入方法 快速集成百度AI API指南