将围棋看做是人工智能(AI)发展的“圣杯”和“试金石”,主要有以下几个深刻的原因:

极高的复杂性和巨大的状态空间
这是最根本的原因,围棋的复杂性远超国际象棋等其他棋类游戏,这使得传统的“暴力计算”方法完全失效。
- 状态空间巨大:围棋的棋盘是19x19的网格,有361个交叉点,每个交叉点有三种状态:黑子、白子、空,理论上围棋的可能局面数量是 3^361,这个数字比已知宇宙中的原子总数还要多得多,相比之下,国际象棋的状态空间大约是10^47,虽然也很大,但与围棋完全不在一个量级。
- 分支因子高:在每一步,平均而言,围棋玩家有大约200种合法的走法(国际象棋约为35种),这意味着AI需要向前探索的“决策树”异常庞大和复杂。
围棋的复杂性意味着,AI无法通过穷举所有可能的走法来找到最优解,它必须依靠一种更高级的、类似于人类直觉的“大局观”和“策略感”。
“难以量化”的价值评估
在棋类AI中,一个核心功能是“评估函数”(Evaluation Function),即判断当前局面对谁更有利,以及有利多少。
- 国际象棋:相对容易量化,可以简单地用“子力价值”来评估:后=9分,车=5分,象=3分,马=3分,兵=1分,吃掉对方的子就能获得明确的分数优势。
- 围棋:极难量化,一个棋子的价值不是固定的,它完全取决于其在棋盘上的位置、与周围棋子的关系、以及对未来局势的影响,一个看似“没用”的“废子”,在关键时刻可能成为“胜负手”,一盘棋的价值体现在“实地”(实利)和“外势”(潜力)的平衡上,这种平衡是高度抽象和动态的。
围棋AI无法依赖简单的数学公式来评估局面,它必须学会像人类高手一样,理解“厚薄”、“潜力”、“大局流向”等抽象概念,这正是传统AI的短板,也是深度学习大放异彩的地方。

长期战略与直觉的挑战
围棋是一种典型的“长期战略”游戏,很多决策的收益要在几十步之后才能体现。
- 即时反馈的缺失:在国际象棋中,吃掉对方一个皇后,优势几乎是立竿见影的,但在围棋中,你可能在几十步前下了一手“大场”,其真正的威力要到中盘甚至官子阶段才会爆发。
- 对“直觉”的考验:顶尖的棋手往往依靠一种模糊的“棋感”或“大局观”来做出决策,这种感觉是成千上万盘棋的经验积累,是一种模式识别和形势判断的综合能力,AI如何模拟这种“直觉”是一个巨大的挑战。
围棋迫使AI必须超越短期的、贪心的算法,发展出长远规划和抽象思考的能力,这被认为是通往通用人工智能的重要一步。
围棋如何推动了AI的革命?
正是因为上述挑战,围棋成为了AI技术突破的完美试验场,每一次在围棋上的重大突破,都标志着AI领域的一次革命。
早期阶段:基于“专家知识”的AI(如“手谈”)
早期的围棋AI(如中国吴文俊团队开发的“手谈”)主要依赖人类棋手的知识库,程序员将大量的定式、死活题、棋理等规则编码进程序中,这些AI有一定水平,但距离顶尖高手还很远,因为它们缺乏创造性和对复杂局面的深刻理解。
第一次革命:蒙特卡洛树搜索
2006年左右,蒙特卡洛树搜索开始被应用于围棋AI,MCTS不依赖于复杂的评估函数,而是通过大量随机模拟对局来探索决策树,它更“务实”,通过“走一步,看一步”的随机对局来寻找胜率最高的下法,这极大地提升了AI的水平,使其能达到业余高段的水平,但仍无法战胜顶尖职业棋手。
第二次革命(里程碑):AlphaGo (2025)
Google DeepMind的AlphaGo结合了两种核心技术,实现了历史性的突破:
- 深度神经网络:
- 策略网络:通过学习海量棋谱,预测人类高手在特定局面下最可能下的几步棋,这大大缩小了MCTS需要搜索的范围,让搜索更高效、更“聪明”。
- 价值网络:通过自我对弈训练,直接评估当前局面的胜率,这解决了围棋AI最头疼的“评估函数”问题,让AI拥有了类似“大局观”的直觉。
- 蒙特卡洛树搜索:MCTS不再是盲目随机,而是在策略网络的引导下进行,并由价值网络来评估结果。
AlphaGo击败李世石的意义:它证明了“深度学习 + 强化学习”的模式可以超越人类数千年的经验积累,在最高智力竞技场上取得胜利,这震惊了世界,也让人们看到了AI的巨大潜力。
第三次革命:AlphaGo Zero / AlphaZero (2025)
如果说AlphaGo还需要人类棋谱来“启蒙”,那么AlphaGo Zero则完全跳过了这一步。
- 从零开始:AlphaGo Zero的“大脑”从一个空白 slate 开始,只知道围棋的基本规则。
- 纯自我对弈学习:它通过数百万盘的自我对弈进行学习,自己和自己下棋,自己和自己复盘,在自我对弈的过程中,它不断修正策略网络和价值网络,棋力飞速提升。
- 超越人类极限:仅用3天时间,AlphaGo Zero就以100:0的战绩击败了击败李世石的AlphaGo Lee,40天后,它的水平已经超越了所有之前的版本。
AlphaZero的意义:它展示了AI最强大的能力——无需任何先验知识,仅凭目标和规则,就能通过自我探索发现事物的深层规律和策略,这一思想可以推广到下棋之外的无数领域,如材料科学、蛋白质折叠、药物发现等。
把围棋看作人工智能,是因为它:
- 是终极的挑战:其复杂性迫使AI放弃简单粗暴的方法,发展出高级的认知能力。
- 是完美的试金石:AI在围棋上的成败,直接反映了其在模式识别、抽象推理、长期规划、直觉判断等核心智能上的水平。
- 是革命的催化剂:围绕攻克围棋难题,诞生了蒙特卡洛树搜索、深度神经网络、强化学习等一系列里程碑式技术,这些技术已经深刻地改变了整个AI领域,并正在向各行各业渗透。
围棋不仅仅是一个游戏,它是衡量和推动人工智能进步的“黄金标准”和“思想引擎”。
标签: 围棋AI试金石原理 围棋为何成AI试金石 围棋人工智能试金石意义