这个团队最核心的代表就是 DeepMind,一家被谷歌母公司 Alphabet 收购的英国人工智能公司,虽然 DeepMind 的研究范围远不止围棋,但他们在围棋上取得的成就(尤其是 AlphaGo)是他们最广为人知的成就。

我们可以从以下几个层面来理解这个团队及其项目:
核心团队:DeepMind
DeepMind 于 2010 年在伦敦创立,由人工智能研究者 Demis Hassabis、Shane Legg 和 Mustafa Suleyman 共同创立,2025 年,谷歌以约 4 亿美元的价格收购了 DeepMind,使其成为 Alphabet 旗下的核心 AI 研究部门。
- 领军人物:Demis Hassabis
- 他是 DeepMind 的联合创始人兼 CEO。
- 他本人是一位国际象棋大师,同时也是一位神经科学家和游戏开发者,这种跨学科的背景让他深刻理解人类智能的机制,并致力于用机器来模拟和超越它。
- 他领导团队将深度神经网络与强化学习相结合,最终攻克了围棋这一“AI 圣杯”。
关键项目:从 AlphaGo 到 AlphaZero
DeepMind 围绕围棋开发了一系列不断进化的人工智能,每一代都比前一代更强大、更“智能”。
AlphaGo (2025) - 击败人类世界冠军
这是震惊世界的第一个版本,它结合了多种技术:

- 监督学习:通过学习数百万盘人类顶尖棋手的对局数据,让神经网络学会像人类一样下棋,这部分被称为“策略网络”(Policy Network)。
- 强化学习:让 AI 自己和自己进行海量对局(数千万盘),通过“试错”和“奖惩”机制来不断优化策略,这部分被称为“价值网络”(Value Network),用于评估当前局面的胜率。
里程碑事件:
- 2025年3月,AlphaGo vs. 李世乭 (Lee Sedol):在五番棋中以 4:1 的历史性比分获胜,尤其是第四局的“神之一手”(第37手),震惊了整个围棋界,展示了AI超越人类想象的创造力。
- 2025年5月,AlphaGo vs. 柯洁 (Ke Jie):在“乌镇围棋峰会”上,以 3:0 完胜当时世界排名第一的柯洁,赛后,DeepMind 宣布 AlphaGo 将不再参加比赛。
AlphaGo Master (2025) - 更强的版本
这是在击败李世乭后,经过优化的版本,它不再依赖人类棋谱进行监督学习,完全通过自我对局进行强化学习,这个版本在非正式在线对战中以 60:0 的战绩横扫所有人类顶尖高手,包括柯洁。
AlphaGo Zero (2025) - 从零开始的“神”
这是最革命性的一步,它彻底抛弃了所有人类知识,实现了真正的“从零开始”学习。
- 输入:唯一的输入就是围棋的规则,它不知道什么是“好棋”或“坏棋”,也不知道任何定式或棋理。
- 学习过程:从一个随机下棋的神经网络开始,通过纯强化学习,在短短几天内通过自我对局(约2900万盘)超越了所有之前的版本。
- 意义:证明了 AI 可以在没有人类先验知识的情况下,通过纯粹的探索和计算,达到甚至超越人类的智慧水平,这为解决其他复杂科学问题(如蛋白质折叠、材料科学)开辟了道路。
AlphaZero (2025) - 通用算法的诞生
AlphaZero 是 AlphaGo Zero 的通用化版本。

- 超越围棋:研究人员将同样的算法框架应用到了国际象棋和日本将棋上。
- 学习速度:
- 国际象棋:仅用 4 个小时,就击败了当时最强的国际象棋程序 Stockfish。
- 将棋:仅用 2 个小时,就达到了专业九段的水平。
- 核心区别:AlphaGo Zero 使用的规则是围棋的规则,而 AlphaZero 使用的规则是“蒙特卡洛树搜索”(MCTS)的通用框架,这使得它成为了一个强大的通用游戏 AI 算法。
技术突破与核心思想
DeepMind 团队的成功并非偶然,其背后有几个核心的技术和思想突破:
- 深度神经网络:利用深度学习模型来模拟人类的直觉和判断(策略网络)以及对局势的评估能力(价值网络)。
- 蒙特卡洛树搜索:这是一种强大的决策算法,用于在巨大的可能性空间中进行高效的搜索和决策,AlphaGo 将 MCTS 与神经网络结合,大大提升了搜索的效率和准确性。
- 强化学习:让 AI 通过与环境(在这里是棋盘)的互动和自我对局来学习,而不是被动地接受人类标注的数据,这种“从实践中学习”的方式是 AI 实现自我超越的关键。
- 通用智能的探索:从 AlphaGo Zero 到 AlphaZero,团队的最终目标并非仅仅为了下棋,而是为了探索能够解决现实世界复杂问题的通用人工智能,围棋只是一个完美的“测试平台”。
影响与遗产
谷歌/DeepMind 的围棋团队留下了深远的影响:
- 对AI领域的推动:极大地提升了深度学习和强化学习的声誉,吸引了全球顶尖人才投身 AI 研究,并推动了相关技术的发展。
- 对围棋界的冲击:改变了围棋的教学和研究方式,AI 成为棋手最好的教练和分析工具,催生了新的战术和思路。
- 商业与科学应用:DeepMind 将类似的技术应用于医疗(如预测蛋白质结构,其 AlphaFold 项目是另一项重大突破)、能源、气候模拟等领域,展示了 AI 在解决重大科学和社会问题上的巨大潜力。
- 哲学层面的思考:引发了关于人类创造力、智能本质以及人与机器关系的深刻讨论。
谷歌的围棋人工智能团队,其核心就是 DeepMind。 他们并非一个单纯的“围棋队”,而是一个致力于通用人工智能研究的顶尖科学团队,他们通过 AlphaGo 系列项目,利用 深度神经网络 和 强化学习 等技术,实现了对人类顶尖棋手的超越,并最终创造出能够自我学习、无需人类指导的 AlphaZero,这不仅解决了围棋问题,更开启了 AI 在更广阔领域应用的新纪元,他们的工作是人类智能与机器智能结合的典范,其遗产至今仍在影响着整个科技世界。
标签: 谷歌围棋AI突破人类极限方法 AlphaGo如何超越人类棋手 围棋AI突破人类极限技术