Skip to content

列传 · 周志华

当中国 AI 学界还在仿写英文教材时,他先用一颗西瓜把机器学习写给中国学生看——这本书让一整代中国 ML 研究者用中文打了根基。

鼓楼下的少年与南大的八年

1973 年 11 月,周志华出生于安徽中部一个普通家庭。中学时代他就显露出对数学与编程的浓厚兴趣。1992 年,他以应届生身份考入南京大学计算机科学与技术系——那一年的南大鼓楼校区还保留着民国建筑的红砖灰瓦,计算机系是一个不到两百人的小院落。

接下来八年,他一直待在南大。1996 年本科毕业、1998 年硕士、2000 年博士——本硕博一路在南京大学完成,导师是中国最早研究人工智能的学者之一、南大计算机系前主任陈世福。周志华的博士论文选题颇有先见之明——集成学习(Ensemble Learning),即把多个弱学习器组合成一个强学习器的方法体系。当时这是一个还相当冷门的方向,神经网络刚刚跌入第二个寒冬,支持向量机(SVM)正成为统计学习的主流,集成学习只是几篇 Boosting 与 Bagging 论文之间的小角落。

但他笃信这条路。多年后他回忆:"我读博士的时候选这个方向,没想过它会变成主流。我只是觉得它合理——一个人判断不准,多个人投票就准了,这件事不可能是错的。"

LAMDA:南大的学习与挖掘自适应集成实验室

2000 年博士毕业后,周志华留校任教。从讲师、副教授到教授、博士生导师,他没有像许多同辈那样在欧美做博士后或访问学者——他选择了把根扎在南京。

2003 年,他在南大组建 LAMDA 实验室(Learning And Mining from DatA,学习与数据挖掘组)。这个名字后来在中国 ML 圈里几乎等同于"南大 AI"。LAMDA 的主线研究方向有三条:

  • 集成学习:他把这条线做到了世界级水准。2012 年由 CRC Press 出版的英文专著 Ensemble Methods: Foundations and Algorithms 至今仍是这一领域被引用最多的系统性著作。书中提出的"误差–分歧分解"(error–ambiguity decomposition)成为后来研究集成多样性最常用的理论框架之一。
  • 多示例学习(Multi-Instance Learning, MIL):与他的弟子们一起,他把这一在欧美仅有零星论文的方向系统化为一个完整的子领域,发表了一系列在 NeurIPS、ICML、AAAI 上的奠基性论文,并建立了与图像检索、药物分子分类等应用之间的桥梁。
  • 半监督学习(Semi-Supervised Learning):在标注数据稀缺成为机器学习核心痛点的年代,他与团队提出了 Tri-training、Co-Forest 等多视图算法,至今仍是教材中半监督方法的代表性条目。

到 2015 年前后,LAMDA 已经培养出俞扬、姜远、高尉、詹德川、黎铭、叶翰嘉等多位活跃在中国 ML 一线的研究者——这条"南大学派"几乎构成了今日中国机器学习教学与研究的中坚力量。

西瓜书:用中文写的机器学习

2016 年 1 月,清华大学出版社出版了一本封面印着一颗大西瓜的厚书——《机器学习》,作者周志华。从此中国 ML 圈多了一个昵称——"西瓜书"。

这本书在中文 AI 教育史上的位置几乎独一无二。在它之前,中国学生学机器学习的常规路径有三条:英文教材(Bishop、Murphy 或 Hastie 等的厚厚原版)、Andrew Ng 的 Coursera 课程、以及一些零散的中文译本。中文世界没有一本兼具广度、深度与可读性的本土原创教材。

西瓜书填上了这个空白。它的特别之处不在于内容前沿——它系统覆盖的还是经典 ML(决策树、支持向量机、贝叶斯、聚类、神经网络、概率图模型、规则学习、强化学习),并未收录当时已经火热的深度学习——而在于它是一本用中文母语思维写的教材。每一章的开头是一个生活化的例子("挑西瓜"贯穿全书),每一节的推导都被放在直观图形与数学严格性之间小心地走平衡。书中那些被一代中国学生反复在论文致谢里写下的句子——"本书的写作得到了很多人的帮助"——构成了周志华独特的写作气质。

到 2024 年,西瓜书已累计印刷超过 60 万册——在一本计算机专业书的语境中,这是一个近乎奇迹的数字。它后来又被周志华本人在 2020 年补成《机器学习公式详解》(昵称"南瓜书"),与西瓜书互为表里。一整代中国 ML 研究者——无论后来去了 OpenAI、DeepMind、阿里达摩院,还是去了字节跳动、深度求索——几乎都在本科或研究生阶段读过这本书。

Deep Forest:另一条不靠神经网络的"深度学习"

2017 年,周志华发表了一篇在国际学界引发广泛关注的论文——Deep Forest: Towards an Alternative to Deep Neural Networks(IJCAI 2017)。论文提出 gcForest(multi-Grained Cascade Forest)——一种完全基于决策树集成的深层结构,可以像深度神经网络一样进行层级表示学习,但参数远少、超参数远简单、对小样本更友好。

这篇论文背后是一个朴素而野心勃勃的问题:深度学习的"深度",是否一定要靠神经网络实现? 在大多数研究者已经默认"深度 = 神经网络"的 2017 年,周志华提出了一种近乎反潮流的回答——不一定。他的判断是:神经网络的成功不在于"神经"两个字,而在于"层级表示学习"这一更普遍的机制;而层级表示学习可以由其他可微或不可微的组件实现。

Deep Forest 在学界引发了相当激烈的讨论——支持者认为它给"深度"提供了可解释性更强的路径,反对者认为它在大规模数据上仍难以匹敌深度神经网络的性能。无论评价如何,这是 2010 年代后期为数不多由中国学者主导提出的、有原创性方法论意义的"另一条路"。

学生与学派的回响

LAMDA 的另一条隐性产出,是它的学生。

俞扬——周志华最早的几位博士生之一,后来在 LAMDA 留校任教,现为南大教授,同时担任南栖仙策(一家 AI 决策公司)首席科学家,长期深耕强化学习与决策智能。姜远、高尉、詹德川等人在毕业后陆续在国内一线高校担任教职,把 LAMDA 的研究风格——重视理论、重视可复现、不追逐热点——带到了更多机构。在工业界,周志华门下出去的学生散布在阿里、百度、字节、华为、京东等多家公司的核心 AI 团队,构成了一种隐形的"南大网络"。

这种学派式的传承,在中国 AI 学界并不多见。多数中国教授的实验室是以"导师 + 一届届学生"为单元的松散个体,缺乏共享的方法论与研究品味。LAMDA 不同——它有清晰的研究主线、有共同的论文写作规范、有相互交叉的子方向。一位 LAMDA 的毕业生在博客里写过一句话:"周老师不教我们追什么会议,他教我们如何判断一篇论文是否值得追。"

院长、Fellow 与中国 AI 的第一所学院

2018 年 3 月 5 日,南京大学人工智能学院成立——这是中国 C9 高校中第一所独立的人工智能学院。院长周志华。在那之前,国内的 AI 研究散落在计算机系、自动化系、模式识别国家重点实验室等多个机构里,没有一所大学敢以"AI"为名独立建院。南大率先走出这一步,本身就是一种标志性事件。

院长之外,他的学术荣誉也在这一时期密集到来:ACM Fellow(2016)、IEEE Fellow(2016)、AAAI Fellow(2019)、AAAS Fellow(2019)——他是历史上少数同时获得这四个国际顶级学会会士的中国大陆学者之一。多次担任 ICML、NeurIPS、AAAI、KDD 的 Area Chair,2021 年担任 IJCAI 大会的 Program Chair——这是 IJCAI 历史上首位来自中国大陆的程序委员会主席。

到 2026 年初,他的 Google Scholar 被引超过 11 万次,h-index 超过 130——这两个数字在中国大陆 ML 学者中均位列前茅。

代表性著作

年份作品意义
2012Ensemble Methods: Foundations and Algorithms(CRC Press)集成学习领域的系统性奠基著作
2016《机器学习》(清华大学出版社,俗称"西瓜书")中国大陆 ML 教育最广泛使用的原创教材
2017Deep Forest: Towards an Alternative to Deep Neural Networks(IJCAI)提出 gcForest,挑战"深度 = 神经网络"的默认假设
2018出任南京大学人工智能学院首任院长中国 C9 高校第一所独立 AI 学院
2020《机器学习公式详解》(俗称"南瓜书")西瓜书的数学补丁,覆盖关键推导细节
2021担任 IJCAI Program Chair中国大陆首位 IJCAI 程序委员会主席

太史公曰

太史公曰

观周志华一生治学,其志不在惊艳,而在扎根。他二十二岁进南大、五十二岁仍在南大——三十年间不离不弃地把一所大学的机器学习实验室一砖一瓦地修成中国 ML 研究的中心,这种"留守式"的学术生涯,在这一代醉心于跨国流动与硅谷头条的中国 AI 学者之中,几乎是异类。然而正是这种异类,让他完成了三件真正意义重大的事——第一,在集成学习这条主线上做出有国际话语权的系统性贡献;第二,用一本西瓜书让一整代中国学生用母语完成 ML 启蒙;第三,用 LAMDA 与南大 AI 学院培养了今日中国 ML 的一支主干。三者之中,西瓜书的影响力可能最深远——一个国家拥有自己语言的奠基性教材,意味着她的下一代研究者不再以"翻译者"的身份进入这个领域,而是以"主人"的身份。在 AI 这场关于话语权的世纪竞赛中,能用母语写一本好教材的人,往往比能写一篇 NeurIPS 论文的人更稀缺。后来者翻开西瓜书,看见那颗印在封面上的西瓜,应当记得这件简单的事:把世界讲给自己人听,本身就是一种尊严。

亲历者说

征集中

如果你曾在南京大学 LAMDA 实验室、南京大学人工智能学院与周志华教授共事或求学,或参与过《机器学习》(西瓜书)的成书过程,欢迎提交贡献

参考资料

  1. Zhou, Zhi-Hua (2012). Ensemble Methods: Foundations and Algorithms. Boca Raton: CRC Press.
  2. 周志华 (2016). 《机器学习》. 北京:清华大学出版社. (俗称"西瓜书")
  3. Zhou, Z.-H. & Feng, J. (2017). "Deep Forest: Towards an Alternative to Deep Neural Networks." Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), 3553–3559.
  4. Zhou, Z.-H. (2004). "Multi-Instance Learning: A Survey." Technical Report, Department of Computer Science & Technology, Nanjing University.
  5. Zhou, Z.-H. & Li, M. (2005). "Tri-Training: Exploiting Unlabeled Data Using Three Classifiers." IEEE Transactions on Knowledge and Data Engineering, 17(11), 1529–1541.
  6. 谢文睿、秦州 (2020). 《机器学习公式详解》. 北京:人民邮电出版社. (俗称"南瓜书")
  7. 南京大学人工智能学院 (2018). "南京大学人工智能学院成立大会." 官方公告, March 5, 2018.
  8. ACM (2016). "ACM Names Fellows for Computing Advances that are Driving Innovation."(周志华入选 ACM Fellow)
  9. IJCAI (2021). "IJCAI-21 Program Chair Announcement."
  10. LAMDA Group, Nanjing University. http://www.lamda.nju.edu.cn/ (实验室历年论文与研究方向汇总)