Skip to content

世家 · UC Berkeley / BAIR(伯克利 AI 研究院)

加州大学伯克利分校之于 AI,像旧金山湾区西岸的一座灯塔——从模糊逻辑到贝叶斯网络,从计算机视觉到深度强化学习,每一次范式转换里几乎都有它的身影。

一、模糊逻辑的诞生地

伯克利与人工智能的结缘要从 1965 年那篇划时代的论文说起。当年,伊朗裔美籍学者拉特菲·扎德(Lotfi A. Zadeh)在伯克利电气工程系发表《Fuzzy Sets》,正式提出"模糊集合"的数学框架。它不是后来意义上的"机器学习",但却是早期 AI 中最有影响力的非经典推理工具之一——日本上世纪 80 年代家电、地铁控制、相机自动对焦背后,几乎都站着这套来自伯克利的数学。扎德此后在伯克利执教近半个世纪,培养了一代逻辑学和软计算的学者。

伯克利没有像 MIT、斯坦福那样诞生于"人工智能"四个字被命名的那一刻,但它在每一次 AI 范式转换的关口都站住了脚。这份沉稳,部分来自伯克利电气工程与计算机科学系(EECS)一以贯之的学术氛围——重数学、重系统、不轻易追逐时髦。

二、AIMA 与 Stuart Russell

1986 年,罗素 从牛津来到伯克利。他和后来在 Google 任研究主管的 Peter Norvig 合著的《Artificial Intelligence: A Modern Approach》(AIMA)于 1995 年首版问世。这本书后来被 1500 多所大学采用为教材,先后再版至第四版(2020),是过去三十年里被引用、被翻译、被翻烂得最多的 AI 教科书。

AIMA 的写法是"理性智能体"(rational agent)框架——它不为符号 AI 或连接主义站队,而是把搜索、逻辑、概率、学习、决策放在同一个坐标系里,让学生一开始就学会以问题为中心去看人工智能。这种风格几乎成为伯克利学派的注脚。

罗素本人后来转向 AI 安全研究。2015 年他与辛顿、Stuart Russell 等一同签署《关于人工智能未来的公开信》,2019 年出版《Human Compatible》,提出"可证明对人类有益的 AI"(provably beneficial AI)这一长期议程。在 2023 年的 ChatGPT 浪潮里,他成为最早呼吁监管的资深学者之一。

三、Jordan 学派与概率机器学习

如果说罗素奠定了伯克利的"理性"底色,那么 1998 年从 MIT 转来的 乔丹(Michael I. Jordan)则把伯克利变成了概率机器学习的圣地。

约当被誉为"机器学习教父"——一个本来训练于认知心理学的学者,却几乎以一己之力把贝叶斯网络、变分推断、隐变量模型、图模型推理这套语言带进了主流机器学习。他的学生与博士后名单几乎可以列成一部当代 ML 名人录:吴恩达(吴恩达,斯坦福、Coursera、百度)、David Blei(LDA 主题模型、哥伦比亚大学)、Zoubin Ghahramani(剑桥、Uber AI 首任主管)、Tommi Jaakkola(MIT)、Eric Xing(CMU、MBZUAI 校长)、本吉奥(短期博士后)等。

约当本人在伯克利同时任职 EECS 与统计系——这个跨系任命并非细节,它说明伯克利在 1990 年代就把"机器学习"理解为统计与计算的交汇,而非纯粹的人工智能子领域。这种判断,比硅谷整体的"AI 复兴"早了整整十五年。

值得一提的是,珀尔 虽然主要在 UCLA 任教,但他的因果推断与贝叶斯网络工作与伯克利 Jordan 学派关系紧密——两者共同塑造了北美概率图模型的版图。

四、视觉与机器人——Malik 一脉

伯克利的计算机视觉传统由 Jitendra Malik 领头。1986 年起 Malik 在伯克利执教,他的视觉组培养了一长串后来塑造视觉领域的学者:Jianbo Shi(Normalized Cuts)、Serge Belongie(Cornell Tech 院长)、Trevor Darrell(多模态视觉)、Alyosha Efros(图像合成与无监督视觉)、David Forsyth、Pietro Perona(合作者)。Malik 本人 2019 年获 IJCAI 杰出研究奖,2022 年获 ACM/AAAI Allen Newell 奖。

机器人方向上,Pieter Abbeel 2008 年从斯坦福(吴恩达学生)来到伯克利,建立 Robot Learning Lab。他的学生 Sergey Levine 2016 年留校任教,两人共同把深度强化学习推向机器人领域:从直升机特技飞行(Abbeel 博士论文),到端到端机器人抓取(Levine 等 2016),再到 2017 年 Schulman、Wolski 等提出的 PPO(Proximal Policy Optimization)——后者后来成为 ChatGPT 背后 RLHF 训练的核心算法。

Abbeel 还有一长串伯克利出身的学生进入产业前沿:John Schulman(OpenAI 联合创始人)、Aravind Srinivas(Perplexity 联合创始人 CEO)、Chelsea Finn(斯坦福、Physical Intelligence)、Igor Mordatch(Google DeepMind)。Abbeel 本人 2017 年创办 Covariant,做仓储机器人基础模型,2024 年被 Amazon 部分收购。

五、BAIR、RISELab 与系统底座

2014 年前后,伯克利把分散在 EECS、统计系、ICSI 等多个建制下的 AI 研究力量整合为 Berkeley AI Research(BAIR)。它不是一个独立法人,而是一个跨系研究合作平台,初期约 30 位教授、200 多名学生,到 2025 年已扩展到约 50 位教授、近 600 名研究人员。

与 BAIR 几乎并行成立的,是同样源自伯克利 EECS 的 AMPLab(2011–2016)及其后继 RISELab(2017–2021)和 Sky Computing Lab(2022 至今)。Ion Stoica、Michael Franklin、Scott Shenker 等系统派教授先后主导这条线索——他们做出来的是 AI 时代的"地基":

  • Apache Spark(2009 起,Matei Zaharia 在伯克利的博士工作),后来由 Zaharia 与 Stoica 联合创办的 Databricks 商业化,2025 年估值已突破 600 亿美元;
  • Ray(2017,Robert Nishihara、Philipp Moritz 等),分布式计算框架,OpenAI 用它训练 GPT-3、GPT-4,Anyscale(Stoica 等创办)将其商业化;
  • vLLM(2023,Sky Computing Lab 的 Woosuk Kwon、Zhuohan Li 等),基于 PagedAttention 的高吞吐推理框架,发布一年内成为开源大模型推理的事实标准。

加上 Dawn Song 在区块链与 AI 安全方向的持续工作、Stuart Russell 在 Center for Human-Compatible AI 的研究,伯克利在 2020 年代呈现出"算法 + 系统 + 安全"三位一体的格局——这是它与多伦多、蒙特利尔最大的不同。

六、伯克利系的产业辐射

把视野拉到湾区生态里,伯克利的辐射网络几乎覆盖了所有头部 AI 公司:

  • OpenAI:Schulman、Andrej Karpathy(在伯克利做过暑期研究)、Pieter Abbeel(早期顾问)、Wojciech Zaremba 等多人有伯克利背景;
  • DeepMind:Sergey Levine 早期合作者、Igor Mordatch、Misha Denil 等先后从伯克利出去;
  • Anthropic阿莫代(Dario Amodei 本人虽在普林斯顿读博,但其团队中多名核心成员来自伯克利)、Tom Brown(合作者);
  • Tesla / xAI:Andrej Karpathy 自伯克利暑期实验室起步;
  • Databricks、Anyscale、Covariant、Perplexity:直接由伯克利师生创办。

伯克利对硅谷的影响,与斯坦福对硅谷的影响形式不同——斯坦福是"创业母校",伯克利更像是"骨干工程师与首席研究员的输送带"。

七、作为机构的伯克利 AI

回过头看,伯克利在每一波 AI 浪潮中都没有缺席:1960–70 年代的模糊逻辑、1980–90 年代的概率推理与计算机视觉、2000 年代的统计机器学习、2010 年代的深度强化学习与机器人、2020 年代的大模型系统与安全。它不像 MIT 那样背着"AI 命名者"的光环,也不像斯坦福那样紧贴硅谷资本——它的位置一直是更冷静的"学术 + 系统"双轴。

到 2026 年,BAIR 仍是全球被引用率最高的 AI 研究机构之一,Sky Computing Lab 主导着开源大模型推理基础设施,CHAI(Center for Human-Compatible AI)主导着北美 AI 安全的学术议程。伯克利没有自己造一个 ChatGPT,但 ChatGPT 背后的 PPO 来自伯克利、训练它的 Ray 来自伯克利、推理它的 vLLM 来自伯克利、批评它的 Stuart Russell 也来自伯克利。

太史公曰

伯克利之于 AI,犹齐之稷下、宋之白鹿洞——它不必是开宗立派的祖庭,却是一代代学人交锋讲学之所。从扎德的模糊集合,到罗素的理性智能体,再到约当的概率图模型,伯克利给 AI 提供的从来不是一个口号,而是一套又一套可以被计算、被证明、被工程化的语言。它的可贵之处在于克制:当符号主义如日中天时,它没有把所有筹码押在 LISP;当深度学习一统天下时,它没有放弃概率与因果。今日的大模型时代,伯克利系统派又默默写出了 Spark、Ray、vLLM——三件支撑万亿参数的"水电基建"。一个学派最深的影响,往往不在它的明星论文,而在它训练学生的方式:让你既敢做最前沿的算法,也愿意去打磨最枯燥的系统。这是伯克利留给 AI 的家学。

亲历者说

征集中

如果你曾在 BAIR、RISELab、Sky Computing Lab 或伯克利 AI 相关组学习、工作,欢迎提交贡献

参考资料

  1. Zadeh, L. A. (1965). "Fuzzy Sets." Information and Control, 8(3), 338–353.
  2. Russell, S., & Norvig, P. (1995, 4th ed. 2020). Artificial Intelligence: A Modern Approach. Prentice Hall / Pearson.
  3. Russell, S. (2019). Human Compatible: Artificial Intelligence and the Problem of Control. Viking.
  4. Jordan, M. I. (Ed.) (1998). Learning in Graphical Models. MIT Press.
  5. Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O. (2017). "Proximal Policy Optimization Algorithms." arXiv:1707.06347.
  6. Levine, S., Finn, C., Darrell, T., & Abbeel, P. (2016). "End-to-End Training of Deep Visuomotor Policies." JMLR, 17(39).
  7. Zaharia, M., et al. (2010). "Spark: Cluster Computing with Working Sets." HotCloud '10.
  8. Moritz, P., Nishihara, R., et al. (2018). "Ray: A Distributed Framework for Emerging AI Applications." OSDI '18.
  9. Kwon, W., Li, Z., et al. (2023). "Efficient Memory Management for Large Language Model Serving with PagedAttention." SOSP '23.
  10. Berkeley AI Research (BAIR) Lab. About BAIR. https://bair.berkeley.edu/
  11. Center for Human-Compatible AI (CHAI). https://humancompatible.ai/
  12. Malik, J. (2022). "ACM/AAAI Allen Newell Award Citation."