Skip to content

世家 · IBM 研究院

它参与命名了"人工智能",开创了机器学习,把统计方法带进语言处理,造出击败国际象棋世界冠军的 Deep Blue,又用 Watson 在 Jeopardy! 上震惊世界——蓝色巨人的实验室,是产业 AI 最长的一条河。

一、从沃森实验室到 IBM Research

1945 年,老托马斯·沃森(Thomas J. Watson Sr.)在哥伦比亚大学旁出资创建了 Watson Scientific Computing Laboratory。这是 IBM 与基础研究真正联姻的开端。

1956 年,IBM 在纽约 Yorktown Heights 购下一片山林,由芬兰裔建筑师埃罗·萨里宁(Eero Saarinen)设计,建造一座弧形玻璃幕墙的研究中心。1961 年,小托马斯·沃森(Thomas J. Watson Jr.)将研究部门正式更名为 IBM Research,并把这座新落成的 T. J. Watson Research Center(沃森研究中心)定为总部。

那是冷战中段,IBM 已经凭 700 系列大型机成为商业计算的代名词。研究院从一开始就肩负双重使命:既要为下一代产品提供技术储备,又要在物理、数学、计算理论等基础学科里出"诺贝尔级"的成果。

它做到了。六十多年里,IBM 研究院走出五位诺贝尔奖得主、六位图灵奖得主,是工业界研究院的样板。

而它与人工智能的渊源,从 IBM 的第一台商用电子计算机就已埋下——1953 年起,IBM 701 既是核武器模拟的工具,也是塞缪尔写下第一个学习程序的舞台。蓝色巨人对"机器能学习"的兴趣,比"人工智能"这个词的诞生还早。

二、罗切斯特、塞缪尔与"人工智能"的诞生

1955 年夏天,正在为 IBM 设计 701 大型机的罗切斯特,与麦卡锡明斯基香农 联名签署了那份著名的提案——《关于举办达特茅斯人工智能夏季研究计划的建议》。罗切斯特是 IBM 一方的代表,也是四位发起人中唯一来自工业界的人。

1956 年的达特茅斯会议把"Artificial Intelligence"这个词钉进历史,IBM 是产业界唯一的在场者。这个起跑线,IBM 此后用了七十年也没让出过。

也是在那个夏天前后,IBM Poughkeepsie 实验室的塞缪尔 在 IBM 701 上写出了第一个能从经验中学习的跳棋程序。塞缪尔让程序与自己对弈,记录每一步的胜负权重,逐步调整评估函数。

1959 年他在《IBM Journal》上发表《Some Studies in Machine Learning Using the Game of Checkers》,文中第一次给"机器学习"(machine learning)下了清晰定义——这个词后来成为整门学科的名字。1962 年,他的程序击败了康涅狄格州跳棋冠军罗伯特·尼里(Robert Nealey),成为机器战胜人类高手的最早记录之一。

塞缪尔的工作还有一项被忽视的贡献:他设计的"alpha-beta 剪枝"思想成为了之后所有博弈树搜索的基础——从早期的国际象棋程序,到后来的 Deep Blue,再到 AlphaGo 的搜索框架,都有这条逻辑的影子。AI 的"游戏路线",从这台 IBM 701 上起跑。

三、统计语言学派的胜利

1972 年,捷克裔工程师贾里尼克 从康奈尔大学转入 IBM 沃森研究中心,接掌语音识别与自然语言研究组。彼时主流学界仍信奉乔姆斯基的生成语法,相信语言要靠规则。耶利内克偏不——他坚持用隐马尔可夫模型(HMM)和统计方法处理语音,让数据说话。

那句被反复引用的名言便诞生于此:"Every time I fire a linguist, the performance of the speech recognizer goes up."(每当我开掉一个语言学家,识别率就会上升一截。)这是反讽,也是宣言。

1980 年代,耶利内克的小组率先把统计语言模型大规模用于语音识别,奠定了后来三十年 NLP 的范式。今日的 BERT 与 GPT,论血脉都要回到 IBM 这一支。

紧接着是机器翻译。彼得·布朗(Peter F. Brown)与德拉·彼得拉兄弟(Stephen & Vincent Della Pietra)、罗伯特·默瑟(Robert Mercer,后来成为对冲基金 Renaissance Technologies 的灵魂人物)等人组成的小组,1988 至 1993 年间陆续发表了 IBM Model 1–5 系列论文。

他们摒弃语言学规则,用一份加拿大议会双语会议记录训练统计对齐模型,把翻译当成"噪声信道"问题来解。这是统计机器翻译(SMT)的起点,二十年后才被神经机器翻译(NMT)取代——但它定义了"用数据驱动语言"的整套世界观。

值得一提的是,默瑟与布朗后来双双离开 IBM 加入文艺复兴科技基金,把统计建模思想搬进华尔街,造出了金融史上最赚钱的量化基金 Medallion Fund。AI 与金融的深层联姻,源头之一正是 1990 年代的 IBM Yorktown。

四、Deep Blue:一场世纪对弈

1985 年,卡内基梅隆大学的台湾博士生许峰雄在导师指导下做出了第一台专用国际象棋芯片"ChipTest"。1989 年,他和同伴默里·坎贝尔(Murray Campbell)、托马斯·阿纳泽(Thomas Anantharaman)一同被 IBM 招入沃森研究中心,把项目改名为 Deep Thought,再演化为 Deep Blue

1996 年 2 月,费城。Deep Blue 第一局击败了卫冕世界冠军卡斯帕罗夫,但卡斯帕罗夫稳住阵脚,最终以 4 比 2 取胜。一年后的复赛改写了历史。

1997 年 5 月 11 日,纽约 Equitable Center 35 楼。第六局,仅 19 步,卡斯帕罗夫推倒国王投子认输——人类历史上第一次,国际象棋世界冠军在标准时间制下被机器击败。Deep Blue 每秒可评估两亿个棋局,背后是 30 个 IBM RS/6000 SP 处理器加 480 颗专用 VLSI 芯片。

这不是纯粹的 AI 胜利——它更多是搜索、剪枝与定制硬件的极致工程。但它让全世界相信:机器开始进入人类智力的领地。复赛结束后,IBM 股价上涨数十亿美元;卡斯帕罗夫则在余生反复申诉、研究、并最终接受这个时代的转向。

许峰雄在赛后回忆,复赛前夕团队几乎没睡觉,连续修补开局库与中盘评估。Deep Blue 的胜利是工程师式的胜利——靠一行行代码、一颗颗芯片、一份份开局库累出来的。这是"硬件加搜索"路线的最高峰,也是它的告别仪式:之后十多年里,国际象棋程序的进步主要来自软件,硬件再没成为主角。

五、Watson 与 Jeopardy! 的高光

2007 年,IBM 研究院启动 DeepQA 项目,由戴维·费鲁奇(David Ferrucci)领衔,目标是造一台能在美国知识问答节目 Jeopardy! 上击败人类冠军的机器。这个节目要求选手从模糊提示中反推答案,涉及双关、隐喻、历史、流行文化——比下棋更接近"开放领域智能"。

2011 年 2 月 14 至 16 日,IBM 把这台机器命名为 Watson,与节目史上奖金最多的肯·詹宁斯(Ken Jennings)和最长连胜的布拉德·拉特(Brad Rutter)三度对决。Watson 跑在 90 台 Power 750 服务器、2880 个处理核心、16 TB 内存上,每秒处理 80 万亿次操作。

它的核心架构是一套并行管道:先把 Jeopardy! 提示语解析成多重候选含义、再向 Wikipedia、IMDB 等本地结构化数据并行检索证据、最后用机器学习模型给候选答案排序——一切都要在 6 秒内做完,比人类按按钮还快。整套系统消化了约 2 亿页文本,是 2011 年那个时点最大规模的开放领域问答系统。

三局合计,Watson 拿下 7.7 万美元,詹宁斯 2.4 万,拉特 2.1 万。詹宁斯在最后一题旁边写下了那句载入互联网迷因史的话:"I, for one, welcome our new computer overlords."(在下,谨此欢迎我们的新计算机霸主。)

IBM 是当夜的赢家,AI 上了主流媒体头版。这是 AI 历史上少有的"全民时刻"——全美约 3500 万观众见证机器战胜了人类最强的两个大脑。

六、Watson Health 的折戟与反思

胜利之后,IBM 把 Watson 当作品牌推向产业。2014 年成立 Watson Group,重金押注医疗——癌症诊断、基因组学、药物匹配,与德克萨斯大学 MD 安德森癌症中心、纪念斯隆·凯特琳癌症中心等顶级机构合作。蓝色巨人的口号是:"Watson 将成为医生的认知助手。"

但现实很残酷。2017 年起,多家医院相继终止合作。MD 安德森合作项目花费超过 6200 万美元、未能进入临床。2018 年内部文件被 STAT News 曝光,揭露 Watson 给出"不安全且不正确"的治疗建议。

问题出在多处:临床数据稀疏、训练样本以假病例为主、医学知识结构远比 Jeopardy! 复杂、医生工作流难以被外部 AI 嵌入。一个能赢电视节目的系统,远不足以挑战真实的肿瘤科诊室。

2022 年 1 月,IBM 将 Watson Health 资产以约 10 亿美元出售给私募基金 Francisco Partners——比当年投入与收购成本低得多。这是 AI 商业化史上最昂贵的教训之一:演示视频里的智能,与生产环境里的智能,是两件事

Watson Health 之失,让 IBM 之后对"AI 加垂直行业"格外谨慎。2020 年代后续推进的金融反欺诈、供应链优化、合规审计等方向,全部回到 IBM 真正熟悉的企业基础设施层——做工具,而非替代专业人士。这是付了天价学费换来的克制。

七、深度学习时代的失速与转向

2012 年的 ImageNet 时刻里,IBM 不在场。深度学习革命被谷歌、Meta(当时还叫 Facebook)、OpenAI、英伟达等接力推动,IBM 既无 GPU 平台、也无大规模消费级数据。Watson 路线押注于"知识工程 + 浅层 NLP",正是 2010 年代后半段被深度学习全面替代的那一套。

但 IBM 研究院并未停下。它的转向集中在三处。

一是 MIT–IBM Watson AI Lab。2017 年 IBM 投入 2.4 亿美元、与 MIT 合作十年,研究下一代 AI 算法、可信 AI 与产业应用。它是工业界与顶级学府结盟的样板。

二是 AI 加速器硬件。2021 年发布 Telum 处理器,把 AI 推理引擎集成进大型机,服务金融反欺诈;2022 年发布专为深度学习推理设计的 AIU(Artificial Intelligence Unit)芯片;与三星合作的 NorthPole 类脑芯片 2023 年登上《Science》——一颗芯片在 ResNet-50 上的能效是 GPU 的 25 倍。

三是量子计算。2019 年发布 IBM Q System One、2023 年宣布 1121 量子比特的 Condor,押注后摩尔时代的算力前沿。AI 与量子的交汇是 IBM 长期看好的下一个赛道。

这三件事的共同点,是它们都以"十年"为时间尺度,都不指望短期内成为收入主力。在硅谷被季度财报与估值倍数追着跑的 2020 年代,IBM 仍坚持长周期的研究院模式——这是它最像贝尔实验室、也最不像同时代竞争者的地方。

2024 年 IBM 还开源了 Granite 系列基础模型,定位"企业级、可审计、合规优先",与开放权重生态接轨。它不再追大模型 SOTA,而是回到自己最擅长的位置:把 AI 嫁给企业、银行、政府的关键系统。

八、研究院作为一种制度

回到机构本身:IBM 研究院的特别之处,在于它是一座由商业公司供养却拥有学术自由的"中世纪修道院"。

它在全球有 12 个实验室——从 Yorktown Heights 到苏黎世、海法、班加罗尔、东京、北京、内罗毕。每个实验室都有自己的精神侧影:Yorktown 偏算法与系统,苏黎世出过两次诺贝尔物理学奖(1986 年扫描隧道显微镜、1987 年高温超导),海法以密码学与优化见长,东京则在材料与硬件深耕。

这种地理与学科的多线并行,让 IBM 研究院得以在主线产品起伏中维持"研究的连续性"。Watson Health 的失败没有击垮研究院,因为还有量子、还有半导体、还有 AI 加速器。这是一家百年公司能在产业转型期反复存活的底层支撑。

更稀有的,是 IBM 给研究员的"长时间单挑"权力——即便项目暂时无法商业化,只要技术判断成立,就有继续的空间。这种自由度今天在大型公司里已极为罕见,唯有 IBM、贝尔实验室遗产、谷歌 DeepMind 等少数几家保留了部分火种。

也正因如此,IBM 研究院给后世留下的不只是单点突破,而是**"工业研究院该如何运营"的范式**——长周期投入、跨学科招募、与产品部门保持距离又保持对话。当贝尔实验室、施乐 PARC、微软研究院相继衰落或转型,IBM Research 仍在 Yorktown Heights 那座弧形玻璃幕墙里,沿着萨里宁 1956 年画下的那条曲线,把基础研究做下去。

太史公曰

IBM 研究院之于人工智能,犹大汉之萧何——不必以勇冠三军,却为后世立法度。它从达特茅斯就在场,造出第一个机器学习程序、第一个统计语言模型、第一个击败世界冠军的下棋机器、第一台赢下电视答题节目的计算机。每一次"第一",都把 AI 向产业又推进一步。然而到深度学习时代,它失了先机:押错 Watson Health、错过 GPU、错过 Transformer。蓝色巨人不再领跑,但它仍在跑。今日的 IBM 把 AI 嫁给大型机、量子、企业合规,做的是别人不愿做、却最难替代的活。AI 史里能写"产业 AI"四个字的,IBM 是当之无愧的第一笔。

亲历者说

征集中

如果你曾在 IBM Research、Watson Group 或 MIT–IBM Watson AI Lab 工作,欢迎提交贡献

参考资料

  1. Samuel, A. L. (1959). "Some Studies in Machine Learning Using the Game of Checkers." IBM Journal of Research and Development, 3(3), 210–229.
  2. McCarthy, J., Minsky, M. L., Rochester, N., & Shannon, C. E. (1955). "A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence."
  3. Brown, P. F., Della Pietra, S. A., Della Pietra, V. J., & Mercer, R. L. (1993). "The Mathematics of Statistical Machine Translation: Parameter Estimation." Computational Linguistics, 19(2), 263–311.
  4. Jelinek, F. (1997). Statistical Methods for Speech Recognition. MIT Press.
  5. Hsu, F.-h. (2002). Behind Deep Blue: Building the Computer that Defeated the World Chess Champion. Princeton University Press.
  6. Campbell, M., Hoane, A. J., & Hsu, F.-h. (2002). "Deep Blue." Artificial Intelligence, 134(1–2), 57–83.
  7. Ferrucci, D. et al. (2010). "Building Watson: An Overview of the DeepQA Project." AI Magazine, 31(3), 59–79.
  8. Strickland, E. (2019). "How IBM Watson Overpromised and Underdelivered on AI Health Care." IEEE Spectrum, April 2019.
  9. Ross, C., & Swetlitz, I. (2018). "IBM's Watson Supercomputer Recommended 'Unsafe and Incorrect' Cancer Treatments." STAT News, July 2018.
  10. IBM Research. (2021). "IBM Telum Processor: Designed for AI on Z." IBM Newsroom.
  11. Modha, D. S. et al. (2023). "Neural Inference at the Frontier of Energy, Space, and Time." Science, 382(6668), 329–335.
  12. IBM. (2024). "Granite Foundation Models Technical Report." arXiv:2405.04324.