书 · 加拿大 AI 发展史
深度学习三位奠基人中有两位在加拿大——辛顿 在多伦多,本吉奥 在蒙特利尔。这个不到四千万人口、GDP 仅美国十分之一的国家,凭借一个名为 CIFAR 的资助计划,撬动了 AI 史上最重要的一次范式革命。它是连接主义最深的一次寒冬里仅存的几把火种之一,也是 2024 年诺贝尔奖最戏剧性的一次背书。
一、寒冬中的火种:两位异乡人北上
故事的转折发生在 1987 年。
辛顿 当时 39 岁,在卡内基梅隆大学任教。1980 年代中期,里根政府的国防经费日益与军用 AI 挂钩——他不愿把研究成果用于杀人。妻子又厌恶美国的医疗系统。1987 年,多伦多大学计算机科学系系主任 Geoffrey Hinton 一个电话过来,他北上多伦多大学接任职位,全家迁往这座对外国学者格外宽容的城市。这次北迁在当时看不出意义,但二十年后被证明改变了 AI 史的走向——美国失去了一位日后将拿下图灵奖与诺贝尔物理学奖的研究者,加拿大得到了一座未来的"深度学习之都"。六年之后,1993 年,35 岁的 本吉奥 完成贝尔实验室博士后研究,加入蒙特利尔大学(Université de Montréal)。他出生于巴黎、成长于法语魁北克,本科与博士都在麦吉尔大学完成——这是一次回家。蒙特利尔此后成为他三十年深耕之地,他在这里建立了 LISA 实验室(后更名 MILA)。
寒冬里,辛顿 在多伦多,本吉奥 在蒙特利尔,两人之间是一千个加拿大公里——彼时几乎没人意识到,这条多伦多—蒙特利尔轴线,将成为下一次 AI 浪潮的策源地。
二、CIFAR 的远见:在 AI 最冷的时候投下注
加拿大政府的关键贡献,并非通过高调的政策宣言,而是通过一个名为 CIFAR 的小型机构——加拿大高等研究院(Canadian Institute for Advanced Research)。
CIFAR 1982 年由企业家 Fraser Mustard 创立,专门资助"高风险、高回报"的跨学科基础研究。2004 年,CIFAR 启动 Neural Computation and Adaptive Perception(NCAP)项目,由 辛顿 主持。这个项目每年提供 100 万加元——按当时美国大型 AI 实验室的标准微不足道——但它在神经网络几乎无人投资的年代,把全球少数几位坚守者集合到了一起:辛顿 与 本吉奥 来自加拿大,杨立昆 来自纽约,Sue Becker、Terrence Sejnowski、Bruno Olshausen 各从北美与欧洲加入。这十几个人每年在班夫开两次闭门会,把彼此尚未公开的工作互相批评,再回各自的大学慢慢推进。
2017 年项目升级为 Learning in Machines & Brains,沿用至今。CIFAR 总裁 Alan Bernstein 在 2024 年的回忆中说:"我们没有要求他们短期出成果,没有 KPI,每年只问一个问题——你想做什么。"辛顿 后来多次公开表示,CIFAR 是他在最艰难的二十年里能够坚持下来的关键支撑。
2017 年,加拿大政府基于 CIFAR 多年的成功经验,拨款 1.25 亿加元启动"泛加拿大人工智能战略"(Pan-Canadian AI Strategy)——这是世界上第一个国家级 AI 战略。
三、三大研究中心:Vector、MILA、Amii
战略落地为三家研究所。
Vector Institute(多伦多)2017 年 3 月成立,由 辛顿 任首席科学顾问,Tomi Poutanen 任 CEO。它扎根于多伦多大学与 University Health Network,主攻深度学习与医疗 AI;其董事会由加拿大政府、安大略省政府与 Google、NVIDIA、Royal Bank of Canada 等企业共同组成。Vector 此后培养出 Aidan Gomez(Cohere 创始人)、Sara Hooker(Cohere For AI 实验室主任)等一批人物。
Mila(蒙特利尔学习算法研究所,Montreal Institute for Learning Algorithms)由 本吉奥 1993 年创办、2017 年正式以 Mila 之名重组。它合并了蒙特利尔大学与麦吉尔大学的 AI 团队,成为全球规模最大的深度学习学术研究所之一,常年拥有近千名研究人员与博士生。Mila 是生成对抗网络(GAN,古德费洛 在 Mila 读博期间提出)、注意力机制早期研究、 神经机器翻译、Theano 框架的诞生地。
Amii(Alberta Machine Intelligence Institute,埃德蒙顿)历史最久——其前身可追溯到 2002 年 Rich Sutton 与 Michael Bowling 在阿尔伯塔大学建立的 RLAI 实验室。强化学习是 Amii 的看家本领:从扑克 AI Cepheus、DeepStack(2017 年首个击败职业玩家的德州扑克程序)到 AlphaGo 早期研发中阿尔伯塔出身的研究者贡献,再到 Sutton 与 Andrew Barto 的《强化学习导论》成为全行业教科书。Sutton 因此与 Barto 共同获得 2024 年图灵奖。
三家研究所各有侧重:Vector 以应用 AI 与医疗见长,MILA 以深度学习理论与生成模型见长,Amii 以强化学习见长。它们共同接受联邦战略资助,但保留各自学术独立——这种"国家资助 + 地方自治"的结构成为加拿大 AI 的独特组织样式。
四、加拿大 AI 公司:Cohere、Element AI 与 DeepMind 的加方血脉
加拿大产出了世界级研究者,却长期苦于"留不住公司"——这是另一个事实。
最具代表性的本土公司是 Cohere,2019 年由前 Google Brain 研究员 Aidan Gomez(《Attention Is All You Need》八作者之一)、Nick Frosst 与 Ivan Zhang 在多伦多创立。Cohere 主打企业级大模型,专注 RAG、Embedding 与多语言基础模型,2024—2025 年累计融资超过 10 亿美元,估值约 55 亿美元。它选择不做面向消费者的聊天机器人,而是把模型作为企业 API 售卖——这与硅谷主流路线形成对照。
Element AI 则是另一个故事。2016 年由 本吉奥 与 Jean-François Gagné、Nicolas Chapados 在蒙特利尔创立,曾被誉为加拿大首家 AI 独角兽。但其商业模式始终在咨询与产品之间摇摆,2020 年被 ServiceNow 以 2.3 亿美元收购,估值大幅缩水——成为加拿大学界—产业链断裂的代表案例。
DeepMind 严格来说是英国公司,但其早期人才与方法论中加方贡献巨大——辛顿 曾长期任 Google 高级顾问,加方培养的 David Silver 是 AlphaGo 主要架构师之一,AlphaGo 击败 李世石 的论文中有多位加拿大背景的合作者。DeepMind 落地伦敦,但血脉里有大半来自加拿大学派。
此外,加拿大还有 ServiceNow 旗下的研发中心、Recursion Pharmaceuticals(蒙特利尔/盐湖城两地)、Tenstorrent(多伦多,AI 芯片公司,由 Jim Keller 领导)等代表企业。
五、移民政策与人才聚集
如果要追问"为什么是加拿大",移民政策给出了一个具体答案。
加拿大长期推行"按技能打分"的 Express Entry 移民系统,允许 STEM 高学历人才在数月内拿到永居。2017 年特鲁多政府推出 Global Talent Stream,承诺为高技能技术工人在两周内办理工作签证——这恰好与美国 H-1B 抽签难、留学转工签繁琐的窘境形成鲜明对比。Vector Institute 公布的数据显示,2017—2023 年间多伦多 AI 从业者数量增长超过六倍。
2023 年特鲁多政府再推 Tech Talent Strategy,明确鼓励持有美国 H-1B 签证的工程师转往加拿大;推出后头三天即收到上限 1 万份申请。多伦多、蒙特利尔、温哥华成为继旧金山之后北美最密集的 AI 工程师聚居地。
但人才流入不等于公司留下。Vector 与 Mila 培养的博士在毕业后仍有相当大比例选择南下加入 Google、Meta、OpenAI——薪资差距、上市路径、并购市场深度,仍是加拿大无法绕过的结构性短板。
六、当代影响力:从学术到诺贝尔双奖
2024 年 10 月 8 日,瑞典皇家科学院将诺贝尔物理学奖授予 霍普菲尔德 与 辛顿,"以表彰其使用人工神经网络进行机器学习的奠基性发现"。辛顿 在多伦多家中接受电话通知时正穿着睡袍,这一画面随后传遍全球。次日,哈萨比斯 与 John Jumper 因 AlphaFold 拿下诺贝尔化学奖——虽然 DeepMind 落地伦敦,但 哈萨比斯 早年与多伦多学派交流密切,AlphaFold 的方法论也根植于深度学习的加拿大传统。
两年前的 2018 年,辛顿、本吉奥、杨立昆 共同获得图灵奖。2024 年,Sutton 与 Barto 因强化学习再获图灵奖。短短七年里,加拿大学派从两届图灵奖到两届诺贝尔奖,把"高校 + CIFAR"模式推上了世界学术的最高领奖台。
辛顿 在 2023 年 5 月辞去 Google 副总裁职务,公开警告 AI 风险。他后来解释:以前我说服自己"我不参与,别人也会做";现在我相信,至少我可以自由地说话。他的离开不是叛逃,而是一种延续——一个老人坚持在新阶段继续做异端。七、加拿大 AI 战略:SCALE AI 与未来路径
除了 Pan-Canadian AI Strategy,加拿大政府还在 2018 年通过 ISI(Innovation Superclusters Initiative)拨款 2.3 亿加元创立 SCALE AI——一个总部位于蒙特利尔的"AI 供应链超级集群",旨在把 AI 推向零售、物流、制造业。截至 2024 年,SCALE AI 已资助超过 130 个产业项目。
2024 年加拿大政府宣布投入 24 亿加元加码"加拿大 AI 主权计算"(Canadian Sovereign AI Compute Strategy),目标在 2026 年前建成本国 GPU 集群与公共算力配额,使 Cohere 等公司不必完全依赖 AWS、GCP、Azure。同年加拿大《人工智能与数据法案》(AIDA)在国会推进,对应高风险 AI 系统的合规义务,与欧盟 AI Act 形成呼应。
加拿大 AI 的未竟之问是规模——如何把世界级的研究、世界级的人才、世界级的政策,转化为世界级的公司。Cohere 是一次答卷,但孤例难成通例。如果未来十年加拿大不能孕育出至少一家千亿美元级别的 AI 公司,"深度学习之都"或许将仅仅停留在一个学术意义上的称号。
太史公曰
余观加拿大 AI 半世纪史,叹其以小博大之妙。国土辽阔而人口稀疏,工业不及美国之繁,资本不及华尔街之厚,然神经网络寒冬最深之时,独此国敢于在无数人嘲笑下继续支持辛顿、本吉奥。CIFAR 一项目,年费百万,二十年间不过两千万加元,却孵出了改变人类的范式革命——投资回报之巨,史上罕有。然加方亦有其痛:DeepMind 落地伦敦,Element AI 卖身美国,Vector 与 Mila 培养之博士多半南下。培养世界顶级人才,留住世界顶级公司——此乃两件事。司马迁曰"穷则变,变则通",加拿大 AI 之变,已由学术变为政策,由政策变为基础设施;下一步若能由基础设施变为产业生态,方可圆满。然能否如此,恐不在多伦多与蒙特利尔之实验室,而在渥太华之政策、温哥华之资本与不远处那个庞大邻国之引力。
亲历者说
征集中
如果你曾在加拿大参与 AI 研究或创业,欢迎提交贡献。
参考资料
- Hinton, G. E., Osindero, S., & Teh, Y. W. (2006). A fast learning algorithm for deep belief nets. Neural Computation, 18(7), 1527-1554.
- CIFAR. (2017). Pan-Canadian Artificial Intelligence Strategy.
- Bengio, Y., Courville, A., & Vincent, P. (2013). Representation learning: A review and new perspectives. IEEE TPAMI, 35(8), 1798-1828.
- Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press.
- Goodfellow, I., et al. (2014). Generative adversarial nets. NeurIPS.
- Government of Canada. (2024). Canadian Sovereign AI Compute Strategy. ISED.
- Royal Swedish Academy of Sciences. (2024). The Nobel Prize in Physics 2024. nobelprize.org.
- Cohere. (2024). Command R+ Technical Overview.




