人工智能相对正确性

99ANYc3cd6 人工智能 2026-03-07 1

这是一个非常深刻且重要的问题，我们来深入探讨一下“人工智能的相对正确性”。

（图片来源网络，侵删）

我们需要明确“正确性”这个词在不同语境下的含义，然后才能理解为什么它对于AI来说是“相对的”。

“正确性”的多重含义

在传统计算机科学中，“正确性”（Correctness）通常有非常明确的定义：

当我们谈论“人工智能”时，尤其是在处理机器学习和深度学习模型时，“正确性”的内涵变得复杂和多样化，它不再是一个简单的二元判断，而是变成了一个多维度、多标准的评估体系。

AI的“相对正确性”主要体现在以下几个方面：

（图片来源网络，侵删）

AI的正确性高度依赖于我们设定的目标函数和评估标准，不同的目标会导致对“正确”的不同定义。

例子1：图像识别
- 目标A：准确率，如果我们的目标是“识别图片中的物体是什么”，那么一张猫的图片被识别为“猫”（95%概率）是“正确”的，但如果我们的目标是“区分纯种猫和田园猫”，那么这个结果就是“不正确”的,因为它没有达到更精细的区分目标。
- 目标B：可解释性，一个模型可能以99%的准确率识别出是猫，但它给出的理由是“图片中有尖尖的耳朵和胡须”，而另一个模型以98%的准确率识别，但给出的理由是“图片中有一个毛茸茸的生物，正在沙发上打盹”，在某些高风险场景（如医疗诊断），后者可能比前者“更正确”,因为它提供了更符合人类逻辑的解释。
例子2：自动驾驶
- 目标A：避免碰撞，一个系统为了绝对避免碰撞，可能会在遇到任何可疑情况时（如一个塑料袋飘过）就急刹车，从“避免碰撞”这个单一目标看，它可能是“正确”的。
- 目标B：平衡安全与通行效率，但人类驾驶员的目标是平衡安全与效率，一个过于“保守”的AI可能会导致交通堵塞和乘客不适，在这种情况下，那个“正确”的系统在实际应用中可能并不“好”，它的“正确性”是相对于“安全至上”这个特定价值观而言的。

AI模型是通过数据训练出来的，因此其“正确性”天生就与训练数据的质量和分布相关。

（图片来源网络，侵删）

偏见问题：如果用于训练人脸识别模型的数据主要来自某一特定人种，那么该模型在识别其他人种时，准确率会显著下降，在这种情况下，我们无法说这个模型是“绝对正确”的，它的“正确性”是相对于其训练数据的分布而言的，它在A数据集上“正确”，在B数据集上就可能“不正确”。
数据漂移：一个在2025年新闻数据上训练的模型，用来识别2025年的网络流行语，其“正确性”会大大降低，因为语言和文化的环境已经改变，模型的“正确性”是相对于特定时间和环境的。

AI（尤其是大语言模型）在处理语言时，其“正确性”极度依赖于语境。

例子：回答“法国的首都是哪里？”
- 绝对正确：“巴黎”。
- 语境下的“正确”：
  - 如果问题是“在18世纪，法国的首都是哪里？”，正确答案是“凡尔赛”。
  - 如果问题是“在法国大革命期间，临时政府所在地是哪里？”,答案可能更复杂。
  - 如果用户是在一个历史小说的讨论中提问,AI的回答可能需要更具文学色彩。
- AI模型生成的回答是否“正确”，取决于它是否准确捕捉了提问者未明说的语境和意图，这种对语境的理解能力，本身就是AI“相对正确性”的核心体现。

这是最复杂也最重要的一点，AI的“正确性”往往承载着人类的价值观,而价值观本身是多元和相对的。

审核AI
- 一个AI需要判断一段内容是否“仇恨言论”。
- 在一个强调言论自由的文化中，对“仇恨言论”的定义可能非常狭窄，AI需要非常谨慎,避免误伤。
- 在一个更强调社会和谐的文化中，定义可能更宽泛,AI需要更主动地限制争议性内容。
- 同一个评论，在A标准下是“正确”的（通过审核），在B标准下就是“不正确”的（被删除），这个AI的“正确性”是相对其所嵌入的文化和伦理框架的。