为何围棋被视为人工智能的试金石？

99ANYc3cd6 人工智能 2025-12-03 45

将围棋看做是人工智能（AI）发展的“圣杯”和“试金石”，主要有以下几个深刻的原因：

（图片来源网络，侵删）

极高的复杂性和巨大的状态空间

这是最根本的原因,围棋的复杂性远超国际象棋等其他棋类游戏，这使得传统的“暴力计算”方法完全失效。

状态空间巨大：围棋的棋盘是19x19的网格，有361个交叉点，每个交叉点有三种状态：黑子、白子、空，理论上围棋的可能局面数量是 3^361，这个数字比已知宇宙中的原子总数还要多得多，相比之下，国际象棋的状态空间大约是10^47，虽然也很大，但与围棋完全不在一个量级。
分支因子高：在每一步，平均而言，围棋玩家有大约200种合法的走法（国际象棋约为35种），这意味着AI需要向前探索的“决策树”异常庞大和复杂。

围棋的复杂性意味着,AI无法通过穷举所有可能的走法来找到最优解，它必须依靠一种更高级的、类似于人类直觉的“大局观”和“策略感”。

在棋类AI中,一个核心功能是“评估函数”（Evaluation Function），即判断当前局面对谁更有利，以及有利多少。

国际象棋：相对容易量化，可以简单地用“子力价值”来评估：后=9分，车=5分，象=3分，马=3分，兵=1分，吃掉对方的子就能获得明确的分数优势。
围棋：极难量化，一个棋子的价值不是固定的，它完全取决于其在棋盘上的位置、与周围棋子的关系、以及对未来局势的影响，一个看似“没用”的“废子”，在关键时刻可能成为“胜负手”，一盘棋的价值体现在“实地”（实利）和“外势”（潜力）的平衡上，这种平衡是高度抽象和动态的。

围棋AI无法依赖简单的数学公式来评估局面,它必须学会像人类高手一样，理解“厚薄”、“潜力”、“大局流向”等抽象概念，这正是传统AI的短板，也是深度学习大放异彩的地方。

（图片来源网络，侵删）

围棋是一种典型的“长期战略”游戏，很多决策的收益要在几十步之后才能体现。

即时反馈的缺失：在国际象棋中，吃掉对方一个皇后，优势几乎是立竿见影的，但在围棋中，你可能在几十步前下了一手“大场”，其真正的威力要到中盘甚至官子阶段才会爆发。
对“直觉”的考验：顶尖的棋手往往依靠一种模糊的“棋感”或“大局观”来做出决策，这种感觉是成千上万盘棋的经验积累，是一种模式识别和形势判断的综合能力，AI如何模拟这种“直觉”是一个巨大的挑战。

围棋迫使AI必须超越短期的、贪心的算法，发展出长远规划和抽象思考的能力，这被认为是通往通用人工智能的重要一步。

正是因为上述挑战,围棋成为了AI技术突破的完美试验场，每一次在围棋上的重大突破，都标志着AI领域的一次革命。

早期的围棋AI（如中国吴文俊团队开发的“手谈”）主要依赖人类棋手的知识库，程序员将大量的定式、死活题、棋理等规则编码进程序中，这些AI有一定水平，但距离顶尖高手还很远，因为它们缺乏创造性和对复杂局面的深刻理解。

2006年左右,蒙特卡洛树搜索开始被应用于围棋AI，MCTS不依赖于复杂的评估函数，而是通过大量随机模拟对局来探索决策树，它更“务实”，通过“走一步，看一步”的随机对局来寻找胜率最高的下法，这极大地提升了AI的水平，使其能达到业余高段的水平，但仍无法战胜顶尖职业棋手。

Google DeepMind的AlphaGo结合了两种核心技术，实现了历史性的突破：

深度神经网络：
- 策略网络：通过学习海量棋谱，预测人类高手在特定局面下最可能下的几步棋，这大大缩小了MCTS需要搜索的范围，让搜索更高效、更“聪明”。
- 价值网络：通过自我对弈训练，直接评估当前局面的胜率，这解决了围棋AI最头疼的“评估函数”问题，让AI拥有了类似“大局观”的直觉。
蒙特卡洛树搜索：MCTS不再是盲目随机，而是在策略网络的引导下进行，并由价值网络来评估结果。

AlphaGo击败李世石的意义：它证明了“深度学习 + 强化学习”的模式可以超越人类数千年的经验积累，在最高智力竞技场上取得胜利，这震惊了世界，也让人们看到了AI的巨大潜力。

如果说AlphaGo还需要人类棋谱来“启蒙”，那么AlphaGo Zero则完全跳过了这一步。

从零开始：AlphaGo Zero的“大脑”从一个空白 slate 开始，只知道围棋的基本规则。
纯自我对弈学习：它通过数百万盘的自我对弈进行学习，自己和自己下棋，自己和自己复盘，在自我对弈的过程中，它不断修正策略网络和价值网络，棋力飞速提升。
超越人类极限：仅用3天时间，AlphaGo Zero就以100:0的战绩击败了击败李世石的AlphaGo Lee，40天后，它的水平已经超越了所有之前的版本。

AlphaZero的意义：它展示了AI最强大的能力——无需任何先验知识，仅凭目标和规则，就能通过自我探索发现事物的深层规律和策略，这一思想可以推广到下棋之外的无数领域，如材料科学、蛋白质折叠、药物发现等。

把围棋看作人工智能,是因为它：

是终极的挑战：其复杂性迫使AI放弃简单粗暴的方法，发展出高级的认知能力。
是完美的试金石：AI在围棋上的成败，直接反映了其在模式识别、抽象推理、长期规划、直觉判断等核心智能上的水平。
是革命的催化剂：围绕攻克围棋难题，诞生了蒙特卡洛树搜索、深度神经网络、强化学习等一系列里程碑式技术，这些技术已经深刻地改变了整个AI领域，并正在向各行各业渗透。

围棋不仅仅是一个游戏,它是衡量和推动人工智能进步的“黄金标准”和“思想引擎”。