围棋人工智能有何核心区别？

99ANYc3cd6 人工智能 2025-12-04 16

这是一个非常好的问题,围棋人工智能之间的区别是围棋AI发展史的核心，也是人工智能领域一个绝佳的案例。

（图片来源网络，侵删）

围棋AI的区别主要可以分为 三个时代，每个时代的AI在 核心技术、棋风、哲学和影响力 上都有根本性的不同。

基于“人类知识”的AI (AlphaGo之前)

这个时代的AI,我们通常称之为 “围棋引擎” (Go Engine)，比如早期的GNU Go、Many Faces of Go (MoGo)，以及更强大的Crazy Stone 和 Zen。

核心技术：

基于规则和启发式搜索：它们的核心思想是“模仿人类”，程序员们会输入大量人类总结的围棋知识，金角银边草肚皮”、“二路之子有缺陷”、“不要下愚形”等。
评估函数：AI会根据这些规则，对棋盘上每一个点的价值进行打分，这个打分函数非常复杂，包含了实地、外势、厚薄、棋子效率等多个方面。
Alpha-Beta剪枝搜索：AI通过模拟未来几步棋（比如10-15步），计算每种可能走法的得分，然后选择得分最高的那一步，由于围棋的分支因子巨大（平均超过250），它无法像国际象棋那样搜索得很深，因此非常依赖人类给出的“知识”来缩小搜索范围。

棋风特点：

（图片来源网络，侵删）

哲学区别：

这个时代的代表是 DeepMind的AlphaGo，特别是战胜李世石的 AlphaGo Lee 和后来横扫中日韩顶尖棋手的 AlphaGo Master。

核心技术：

深度神经网络：这是革命性的变化，AlphaGo不再依赖人类输入的规则，而是自己从海量棋谱（尤其是Master版本）中学习。
两个核心网络：
- 策略网络：直接告诉你“在当前局面下，人类高手最有可能下的几个点是什么”，这大大缩小了搜索范围，效率极高。
- 价值网络：直接告诉你“当前局面下，哪一边的胜率更高”，这取代了传统复杂的评估函数，让局面判断更准确、更接近直觉。
蒙特卡洛树搜索：AlphaGo将MCTS与这两个网络结合，策略网络指导搜索方向，价值网络评估终局，从而在有限的时间内找到最优解。

棋风特点：

（图片来源网络，侵删）

“超越人类”但“仍有迹可循”：AlphaGo的棋风让人类棋手震惊，它下出了“点三三”这样传统理论认为亏损的棋，也下出了著名的“第37手”，颠覆了人类对“实地”和“外势”的平衡认知。
高效而精准：它的计算极其高效，每一步棋的胜率都远超人类，它的棋风不再是“像人类”，而是“超越人类”，但很多决策依然可以从人类知识体系中找到影子。

哲学区别：

这个时代的代表是 AlphaGo Zero 和更通用的 AlphaZero，它们是围棋AI发展的巅峰，也是人工智能的终极形态之一。

核心技术：

棋风特点：

“非人类”且“无法理解”：这是最震撼的一点，AlphaGo Zero的棋风彻底脱离了人类数千年的棋谱和理论，它下出了人类棋手从未想过、甚至无法理解的招法，比如著名的“肩冲”，在人类看来是俗手，但在它看来是效率最高的选择。
极致的效率和平衡：它对围棋的理解达到了一个全新的维度，对“效率”和“平衡”的把握是人类无法企及的，它的棋风没有“好坏”之分，只有“效率”高低之分。

哲学区别：

“机器创造新知识”：AlphaGo Zero的哲学是，AI不仅可以学习人类知识，甚至可以超越人类，创造出全新的、更高级的知识体系。
人类是“旁观者”：在这个阶段，人类已经无法再从AlphaGo Zero的棋谱中学习，因为它的招法已经超出了人类的理解范畴，人类只能作为一个旁观者，惊叹于AI所展现的全新可能性。

特性	传统引擎 (如Crazy Stone)	AlphaGo (如Master)	AlphaGo Zero / AlphaZero
核心技术	基于规则的启发式搜索 + Alpha-Beta剪枝	深度学习 + 蒙特卡洛树搜索	强化学习 + 纯自我对弈
知识来源	人类编写的棋理和规则	海量人类棋谱	从零开始，自我对弈生成数据
棋风	像人类，但保守、平庸	超越人类，但能理解	非人类，无法理解，追求极致效率
哲学	教会机器 (人类是老师)	让机器自己学 (人类是学生)	机器创造新知识 (人类是旁观者)
与人类关系	人类指导AI	人类向AI学习	人类无法理解AI