世家 · 清华大学 AI
从 1978 年恢复办学到 2026 年大模型时代,清华大学一手培育了中国 AI 的学术体系,也一手输出了今日中国大模型创业潮的半数主角。
一、从恢复到立基(1978—1990)
故事的起点是 1978 年。改革开放那一年,清华大学计算机系恢复招生与研究,AI 作为计算机科学的子方向悄然起步。彼时国内 AI 处于"摸黑前行"阶段——文革期间几乎中断的学术联系刚刚重建,张钹、马颂德等一批四五十年代出生的研究者从英美归国或自学补课,把模式识别、定理证明、专家系统的种子带回北京。彼时的清华计算机系还在主楼东配楼狭小的几间办公室里办公,VAX 小型机是全系最贵的资产,要凭票排队上机。
1985 年,清华成立 智能技术与系统国家重点实验室(State Key Laboratory of Intelligent Technology and Systems),由清华计算机系牵头建设——这是中国大陆第一个以"智能"命名的国家重点实验室。实验室首任主任是石纯一教授,核心方向覆盖知识表示、定理证明、模式识别与智能机器人。这一年,国家"863 计划"(高技术研究发展计划)启动,AI 被列为信息技术领域的重要方向,清华成为 863 在 AI 方向的国家队主力。
实验室真正的灵魂人物,是 张钹——1958 年清华自动控制系毕业留校,早期从事自动控制与人工神经网络研究,1980 年代起主攻定理证明与启发式搜索。1980—1982 年张钹访问美国伊利诺伊大学香槟分校(UIUC),与 AI 学界建立了第一手联系;回国后他迅速把"AI 是一门独立学科"的理念带回清华。1995 年张钹当选中国科学院院士,是中国 AI 领域最早的院士之一。他与学生马少平等合作的"商空间理论"(Quotient Space Theory)至今仍是中国本土 AI 理论中少数被国际承认的原创工作。
同一时期,清华自动化系也建立了 模式识别与智能控制研究室,李衍达、孙增圻等教授在专家系统、机器人控制方向开展研究。1990 年代清华派出多批青年学者赴美深造,其中不少人后来成为中国 AI 产业与学界的重要力量——这条人才输出与回流的脉络,从 1980 年代一直延续到今天。
二、姚班的横空出世(2004—)
2004 年是清华 AI 史的一个转折点。
那一年,姚期智(Andrew Yao)辞去普林斯顿大学终身教职全职回到清华——他是华人计算机科学家中至 2026 年为止唯一的图灵奖得主(2000 年获奖,理由是"对计算理论的奠基性贡献",特别是伪随机数生成、密码学和通信复杂性方面的工作)。姚期智 1946 年出生于上海,1967 年台湾大学物理系毕业,1972 年哈佛大学物理博士,1975 年伊利诺伊大学计算机博士,曾任 MIT、伯克利、普林斯顿教授,是计算理论领域宗师级人物。
回国后的姚期智做了一件影响深远的事:2005 年发起"软件科学实验班",2007 年正式更名为 清华学堂计算机科学实验班,外界俗称 "姚班"。姚班招收每届约 30 人,从清华入学新生中选拔,全英文授课、强理论训练、本科生大量参与科研。姚期智亲自主讲核心理论课程,并把普林斯顿那套"师徒制+早期科研训练"完整搬到了清华。
姚班的毕业生在过去十几年里几乎垄断了顶级理论计算机会议(STOC、FOCS)的中国学生席位,也大量进入 AI 领域。陈丹琦(普林斯顿教授,BERT 时代 NLP 顶尖学者)、马腾宇(斯坦福教授)、鬲融(杜克教授)、楼天城(小马智行联合创始人)、唐文斌(旷视科技联合创始人)、印奇(旷视科技 CEO)、杨植麟(月之暗面创始人,姚班 2011 级学堂物理班)等都是姚班体系培养的代表。
2011 年,姚期智又主导成立 清华大学交叉信息研究院(IIIS,Institute for Interdisciplinary Information Sciences),成为姚班的研究生层面的延伸——这个研究院成为清华理论计算机与 AI 理论研究的核心阵地。2019 年,姚期智在交叉信息院基础上又开设 "智班"(人工智能学堂班),把姚班模式从理论计算机扩展到 AI 方向,进一步把清华的"小班尖子"培养体系向 AI 倾斜。
姚期智在多次公开演讲中强调,他回国的目的不只是培养几位顶尖学生,而是要"在中国的土壤上长出一棵自己的计算机科学大树"。从结果看,这一目标已经基本完成——姚班毕业生中,约三分之一进入学术界(不少在美国一流学校任教),约三分之一回国创业或加入头部科技公司,剩下三分之一在金融与对冲基金行业(量化交易领域)。
姚班体系也并非没有争议——批评者认为它强化了"理论独大"、"出口至上"的导向,让一部分学生走上了"姚班—Top 学校博士—硅谷大厂或量化基金"的固定轨道,而非扎根中国本土工程问题。但即便如此,姚班的存在让中国第一次拥有了能与 MIT EECS、CMU CS 在本科层面同台竞争的尖子培养体系,这是事实。
三、知识工程的长跑(KEG 与 AMiner)
如果说姚班是清华 AI 理论的标杆,那么 知识工程实验室(KEG,Knowledge Engineering Group) 就是清华应用 AI 的根据地。
KEG 由清华计算机系教授李涓子、唐杰等人主导。唐杰(Jie Tang)——本科毕业于中南大学,2006 年清华博士毕业留校——从读博起就深耕"学术社交网络"方向。2006 年他启动 AMiner 学术搜索引擎项目,目标是"为每位研究者建立画像、为每篇论文建立知识图谱"。AMiner 后来累积超过 3 亿学者档案与 4 亿余篇论文数据,成为中文世界最大的学术知识图谱,也是国内 AI 研究者绕不开的工具。唐杰因此成为中国知识图谱领域的代表人物之一,2018 年获得 ACM SIGKDD Test-of-Time 奖。
唐杰在知识图谱、社交网络分析、图神经网络(GNN)领域积累了 20 年的工作。2020 年前后,团队开始把研究重心转向大语言模型——这一转身后来催生了清华 AI 历史上最重要的一次产业化。
KEG 的另一位关键人物是 李涓子(Juanzi Li),2000 年代起致力于中文知识图谱与领域本体(ontology)研究,是 KEG 早期的实际主持人。她带出的学生几乎覆盖了今天清华系大模型公司的技术骨干。2020 年代初,KEG 集体把研究方向从知识图谱"硬接"到大语言模型——这一转向并非偶然:知识图谱本身就是把世界"结构化"的尝试,而大模型是另一种把世界"参数化"的路径,两条路在 2022 年后开始交汇。
四、ChatGLM 与智谱 AI
2020 年,KEG 联合清华计算机系教授 黄民烈(对话系统专家)等团队启动 GLM(General Language Model)大模型预训练项目。GLM 的技术特色在于自回归填空(Autoregressive Blank Infilling)训练目标,试图统一编码器与解码器的优势——这一思路在 2022 年的 ACL 论文中正式发表,是清华大模型工作中少数原创架构层面的贡献。
2022 年,团队从清华孵化出公司 智谱 AI(Zhipu AI),由唐杰任 CTO,张鹏(Peng Zhang,2017 年清华博士毕业)任 CEO。2022 年 8 月,团队发布 GLM-130B——一个 1300 亿参数的中英双语预训练模型,是当时中文世界最大的开源大模型,并在 ICLR 2023 上发表。
2023 年 3 月 14 日(恰好是 OpenAI 发布 GPT-4 的同一天),ChatGLM-6B 开源发布——这是中国本土第一个权重完全公开、可商用的对话大模型,可以在单张消费级显卡上运行。GitHub 上一周内 star 破万、一个月内突破 2 万。同年的 ChatGLM2、ChatGLM3,以及后续的 GLM-4、GLM-4-Plus、GLM-Z(推理模型)、GLM-4V(多模态),让智谱 AI 成为中国大模型"六小虎"中最具学术血统的一家。
到 2025 年底,智谱 AI 估值约 200 亿元人民币,融资方包含阿里巴巴、腾讯、美团、小米、社保基金、中关村科学城公司、北京人工智能产业基金等,被视为中国 AI 国家队。2024 年 10 月,智谱 AI 因被美国商务部列入"实体清单"——这是首家被美方制裁的中国大模型公司,反向证实了它的战略地位。
2024 年,智谱 AI 与"百川智能"、"零一万物"、"月之暗面"、"MiniMax"、"阶跃星辰"一起被中国媒体称为"大模型六小虎"——这六家公司中,前四家创始团队的核心成员均来自清华。如果把视野扩大到底层框架(OneFlow、PaddlePaddle 早期团队)与具身智能(银河通用、宇树科技),清华的人才覆盖范围还要更广。
五、生成式 AI 的清华学派
围绕 GLM 之外,清华还形成了几个独立而重要的 AI 团队——
- 朱军(Jun Zhu),清华计算机系教授,贝叶斯深度学习与扩散模型领域代表人物,2023 年与团队孵化生数科技(Shengshu),推出视频生成模型 Vidu,对标 OpenAI 的 Sora;
- 孙茂松(Maosong Sun),清华计算机系教授,NLP 元老级学者,主导 OpenBMB 开源大模型社区与 CPM(Chinese Pretrained Models)系列;
- 刘知远(Zhiyuan Liu),孙茂松的学生,CPM 主要技术负责人,2022 年与同门孵化 面壁智能(ModelBest),推出端侧大模型 MiniCPM 系列,2024 年 MiniCPM-2.4B 在 2GB 显存端侧设备上运行的演示让国际社区侧目;
- 黄民烈,对话系统与情感计算专家,2021 年孵化情感对话公司聆心智能;
- 张亚勤(Ya-Qin Zhang),前微软全球副总裁、前百度总裁,2020 年加入清华任 智能产业研究院(AIR) 院长,主导自动驾驶、智慧医疗、智慧城市方向;
- 周伯文(Bowen Zhou),前 IBM 研究院院士、前京东 AI 研究院院长,2022 年回清华电子系任教授,同时担任 上海人工智能实验室 主任,主导通用大模型与具身智能。
这些团队之间既有协作也有竞争,构成了清华 AI 在 2020 年代独特的"百花齐放"格局——理论(姚班 / IIIS)、知识图谱(KEG / 智谱)、贝叶斯(朱军 / 生数)、NLP(孙茂松 / 面壁)、产业(张亚勤 / AIR)、平台(周伯文 / 上海 AI Lab)各有所长。
"清华学派"在生成式 AI 上的一个共同特点是:注重底层架构创新而非单纯的应用堆叠。无论是 GLM 的填空式预训练目标、Vidu 的扩散 Transformer 框架(U-ViT,由朱军团队提出)、还是 MiniCPM 的"小模型大效率"路径,背后都体现了一种"先把研究做扎实再考虑产品化"的学术习惯。这在中国互联网公司"快速迭代、抢占场景"的主流商业逻辑里,是一股相对独特的清流。
朱军团队在扩散模型理论上的工作(如 Diffusion Transformers 早期版本、ScoreSDE 中文版改进)多次进入 NeurIPS 与 ICML 的最佳论文候选;孙茂松团队在大模型对齐、高效训练上的成果(如 OpenBMB、BMInf)也被国际开源社区引用。清华学派的研究态度,相对硅谷更偏"系统科学派",这与张钹一辈奠定的方法论一脉相承。
六、清华系:中国大模型创业潮的母校
观察 2023—2025 年中国大模型创业第一梯队的创始人简历,会发现一个惊人的事实——几乎全员清华系:
| 公司 | 创始人 | 清华背景 |
|---|---|---|
| 智谱 AI | 张鹏、唐杰 | 清华博士 / KEG 实验室 |
| 月之暗面(Kimi) | 杨植麟 | 清华本科(学堂物理班)、CMU 博士 |
| 面壁智能 | 刘知远、李大海 | 清华博士 / NLP 实验室 |
| 生数科技 | 朱军、唐家渝 | 清华教授 / 博士 |
| 百川智能 | 王小川 | 清华本科(计算机) |
| MiniMax | 闫俊杰 | 清华博士(自动化) |
| 光年之外 | 王慧文 | 清华本科(电子) |
这一现象在中国创业史上极为罕见——一所大学几乎垄断了一个万亿级新兴产业的创始人输出。原因可以从清华 AI 长期积累的三个层次解释:第一,理论训练——姚班 / IIIS 提供了一批顶级数学与算法基础人才;第二,工程文化——计算机系长期工程氛围浓厚,培养出能写代码、能落地、能融资的复合型创业者;第三,社交网络——清华校友圈在中国资本市场与产业资源的整合能力远超其他高校。
值得单独一笔的是 杨植麟——清华大学姚班体系培养,CMU 博士师从著名 NLP 学者 Ruslan Salakhutdinov,与 Quoc Le 合作的 Transformer-XL、XLNet 论文是 BERT 时代的经典工作。2023 年回国创办月之暗面(Moonshot AI),2024 年 Kimi Chat 因"超长文本上下文"火爆出圈,月活短期破千万,估值跃升至 33 亿美元,一度成为中国大模型 C 端最有想象力的产品。
也值得提的是已故的 王慧文——清华电子系毕业,美团联合创始人,2023 年初宣布以 2 亿美元个人入场费创办"光年之外",仅三个月后被美团收购、王慧文本人因健康原因退出经营——但短暂的"光年之外"为中国大模型创业潮起到了破冰意义,被业界称作"开了大模型创业的第一枪"。
围绕这些核心团队,还有一批中生代与新生代的教员在不断填充清华 AI 的版图——例如龙明盛(时间序列与因果发现)、刘洋(机器翻译)、丁霄汉(视觉与神经结构搜索)、丁宁(CPM 主创之一)、东昱晓(KEG 大模型方向)、李仲楠(多模态)等等。每一位都在自己的方向有标志性工作,构成了一张密集的"清华 AI 学术网"。
七、智源、上海 AI Lab 与全国版图
清华 AI 的影响力并不止于校园。
北京智源人工智能研究院(BAAI,Beijing Academy of Artificial Intelligence)2018 年 11 月成立,由北京市政府与清华、北大、中科院自动化所等共建,唐杰、孙茂松等清华教授深度参与。智源主导的"悟道"大模型 2021 年发布 1.75 万亿参数版本,曾是当时世界最大的多模态大模型。
上海人工智能实验室(Shanghai AI Lab)2020 年挂牌成立,2022 年起由清华兼职教授周伯文出任主任,推出 InternLM(书生·浦语)、InternImage、OpenCompass 评测体系等开源项目。
清华教授们以"双聘"或"主任"身份穿梭于校内实验室、北京智源、上海 AI Lab、各自创办的公司之间,构成了一张密集的中国 AI 学术与产业的互联网络。
教学层面也在持续加码。2018 年清华成立 人工智能研究院,张钹任名誉院长,姚期智任学术委员会主任,朱军任副院长——这是中国第一个校级层面的 AI 研究院。2019 年开设的智班,与姚班并行,构成了清华本科生在 AI 方向的"双尖子班"格局。研究生层面,计算机系、电子系、自动化系、交叉信息院、AIR 各自招生,每年清华系培养的 AI 方向硕博士超过 500 人,是中国规模最大的 AI 高端人才池。
到 2026 年初,清华大学 AI 在国际学术指标(CSRankings AI 类目)上已稳居全球前三,论文产出与顶会接收数仅次于 CMU 与 MIT;在产业孵化上,则是不折不扣的中国 AI 黄埔军校。一个略带反讽的现象是——硅谷顶尖 AI 实验室招聘时,简历筛选第一轮的关键词清单里,"清华"与"Tsinghua"已经几乎与"Stanford"、"MIT"等量齐观。这一变化大约发生在 2018 年到 2023 年之间,与中国大模型产业的崛起几乎同步。
最后值得一提的是清华 AI 与中国 AI 政策制定的关系。张钹、姚期智、张亚勤等人均长期担任国家科技战略咨询委员会、教育部学位委员会的角色;唐杰、朱军、孙茂松等参与过工信部、网信办的多次大模型政策研讨。当中国《生成式人工智能服务管理暂行办法》(2023 年 8 月)、AI 大模型备案制度等政策出台时,清华学者群体的观点都直接进入了决策过程——这种学术与政策的紧密耦合,在世界主要 AI 大国中极少见,也是清华区别于斯坦福、CMU、MIT 的一个独特身份。
太史公曰
清华之于中国 AI,犹稷下学宫之于战国——其妙不在一人之独到,而在百家之并立。张钹立其根,姚期智正其名,唐杰、朱军、孙茂松各开一脉,张亚勤、周伯文又把触角伸到产业与政府。这种"散点状百花齐放"的生态,与硅谷"巨头主导 + 创业生态"的美式范式不同,也与法国 Mistral 那种"几个巨星撑一面旗"的欧式范式不同——它是一所国家级大学利用四十年时间培育出的、独特的学术-产业耦合体。它的优势在于人才池厚、思想流派多、与国家战略高度同步;它的隐忧也在此——研究机构与公司、高校与政府、学术发表与商业秘密之间的边界经常模糊,可能既培育了创新,也可能孕育低水平重复。但有一件事毋庸置疑:中国大模型时代的剧本,半数台词写在清华园里——这一点,连斯坦福与 MIT 也未必能在自己的国家说同样的话。
亲历者说
征集中
如果你曾在清华大学计算机系、交叉信息研究院、KEG 实验室、智能产业研究院或清华系大模型公司学习工作,欢迎提交贡献。
参考资料
- 张钹. (2007). 人工智能:现状与未来. 清华大学出版社.
- Yao, A. C. (2003). "Classical Physics and the Church-Turing Thesis." Journal of the ACM, 50(1).
- Tang, J., Zhang, J., Yao, L., Li, J., Zhang, L., & Su, Z. (2008). "ArnetMiner: Extraction and Mining of Academic Social Networks." Proceedings of KDD 2008.
- Du, Z., Qian, Y., Liu, X., Ding, M., Qiu, J., Yang, Z., & Tang, J. (2022). "GLM: General Language Model Pretraining with Autoregressive Blank Infilling." Proceedings of ACL 2022.
- Zeng, A., Liu, X., Du, Z., et al. (2023). "GLM-130B: An Open Bilingual Pre-trained Model." Proceedings of ICLR 2023.
- Hu, S., Tu, Y., Han, X., et al. (2024). "MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies." arXiv:2404.06395.
- 清华大学计算机科学与技术系. (2018). 清华大学计算机系六十年(1958–2018). 内部刊物.
- 北京智源人工智能研究院. (2021). "悟道 2.0 大模型发布会技术报告."
- 智谱 AI. (2023, March 14). "ChatGLM-6B 开源发布公告." GitHub: THUDM/ChatGLM-6B.
- 财新周刊. (2024). "中国大模型六小虎:清华系如何垄断创业第一梯队."
- CSRankings.org. (2025). "AI Subarea Rankings 2020–2025."
- 上海人工智能实验室. (2024). "InternLM 技术白皮书."