Skip to content

书 · 日本 AI 发展史

第五代计算机计划是 AI 历史上最昂贵的一次国家级豪赌,它的失败把日本推入"失落的三十年"AI 叙事。然而日本机器人传统从未中断,深度学习时代它又以 Preferred Networks、Sakana AI、Sony AI 等公司悄然回到牌桌。少子化的人口压力、对版权的宽松法律解释、对机器人的文化亲和——三股暗流支撑着一个被低估的 AI 国家。

一、战后机器人传统:从 WABOT 到 ASIMO

日本 AI 的第一段叙事,不在算法,而在身体。

1973 年,早稻田大学的加藤一郎教授团队完成 WABOT-1 的研制——这是世界上第一台全尺寸人形机器人,能用人造嘴说简单日语,用机械手抓取物体,用双腿缓慢走动。1980 年的 WABOT-2 进一步会读乐谱并演奏电子琴。加藤被尊为"人形机器人之父",他奠定的研究范式延续至今——日本 AI 的关注点是"如何让机器与人共处",而不是"如何让机器超越人"。

1986 年,本田汽车在京都的一家秘密实验室启动人形机器人项目。1996 年第一代 P2 公开亮相时全场震惊:一台 1.82 米高、210 公斤重的机器人,竟然能够稳定地双足行走。2000 年,本田发布更小巧的 ASIMO(Advanced Step in Innovative Mobility),身高 1.3 米,能上下楼梯、辨认人脸、奔跑、踢足球。ASIMO 在 22 年里巡演全球,被联合国请上演讲台,被奥巴马接见,2022 年正式退役。它的退役不是失败——而是日本机器人产业把人形机器人交还给学术界与新一代创业者(如 Boston Dynamics、Figure、特斯拉 Optimus)的一个仪式性瞬间。

工业机器人领域,"四大家族"中两家来自日本——发那科(Fanuc,1972 年从富士通独立)与安川电机(Yaskawa,1915 年创立)。它们与 ABB(瑞士)、库卡(德国,2016 年被美的收购)共同瓜分全球工业机器人市场。截至 2024 年,全球 38% 的工业机器人由日本厂商制造,远高于其他任何国家。这是一种沉默而扎实的优势。

二、第五代计算机计划:辉煌与失败(1982—1992)

1982 年,日本通商产业省(MITI,今经济产业省 METI)宣布启动"第五代计算机计划"(Fifth Generation Computer Systems Project, FGCS),由 渕一博 担任 ICOT(新一代计算机技术研究所)所长。十年预算 8.5 亿美元,目标是用并行逻辑编程和符号推理打造下一代"知识信息处理"计算机。

这个计划在国际上引发的恐慌远超日本预期。美国国会迅速通过《国家合作研究法》解除反垄断限制,DARPA 启动战略计算计划(10 亿美元),微电子与计算机技术公司(MCC)应运而生;英国成立 Alvey 计划,欧共体启动 ESPRIT。一时间整个西方都担心日本要在 AI 上完成"第二次半导体奇袭"。

ICOT 在十年里训练出三百多名研究员,开发了基于 Prolog 衍生语言 KL1 的并行推理机 PIM/p、PIM/m、Multi-PSI 等十余款机器,发表论文数千篇。但站在 1992 年项目结束时回看,结果令人尴尬:硬件性能未达商业级,并行逻辑编程范式被工业界冷落,神经网络与统计机器学习正在全球抬头。渕一博 在结项报告中坦言:"我们押注了一种范式,而世界选择了另一种。"

第五代计算机的失败成为日本 AI 史的分水岭。它一方面塑造了"政府主导、长期投入"的资助文化,另一方面也让此后二十年日本对 AI 国家级项目格外谨慎——这种谨慎,恰好让日本错过了深度学习的早期波浪。详见《世家·ICOT》。

三、失落的三十年:错过深度学习浪潮

1990 年代后半到 2010 年代初,是日本 AI 学术与产业最沉默的二十年。

原因复杂。第五代失败造成的"AI 冬季叙事"使政府与企业回避大规模 AI 项目;泡沫经济破灭后日本企业全面转向"成本控制";学术界因终身教职制度刚性、英语能力相对薄弱,国际顶会论文份额持续下滑。1995 年到 2012 年间,日本研究者在 NeurIPS、ICML 上的论文份额从 8% 降到 2%。当 ImageNet 2012 引爆深度学习时,日本几乎没有任何一支可与多伦多、纽约、Google Brain 抗衡的工业研究团队。

这段失落期被一句日本科技圈广泛流传的话精准概括:"世界变了,我们没变。"

四、Preferred Networks:从 Chainer 到工业 AI

变局始于 2014 年。

岡野原大輔与西川徹两位东京大学博士毕业生,于 2008 年共同创立 Preferred Infrastructure(PFI),主攻分布式数据库与大规模文本处理。2014 年他们剥离 AI 团队成立 Preferred Networks(PFN),把方向押注在深度学习与工业应用。

PFN 留给世界的最重要产物是 Chainer——2015 年开源的深度学习框架,首次提出"按运行定义计算图"(define-by-run)的动态图思路。这一设计后来被 PyTorch 完全继承,成为现代深度学习框架的事实标准。Chainer 在 2019 年宣布迁移到 PyTorch,PFN 把"框架战争"让给了硅谷,转而专注垂直应用。

PFN 此后与丰田合作研发自动驾驶感知系统、与 FANUC 合作工厂智能机械臂、与三菱化学合作分子模拟。2018 年它推出 Optuna——开源超参数自动调优库,至今仍是最广泛使用的 Python 调参工具之一。2024 年 PFN 发布 PLaMo(PFN Large Model)系列日语大模型,与日本厚生劳动省合作建立医疗大模型。

PFN 几乎是日本 AI 产业一个独特的参考样本:技术上对标硅谷,但坚持留在东京、坚持服务日本制造业。它在 2024 年估值约 35 亿美元,是日本最具影响力的 AI 创业公司。

五、学术:松尾研究室、京大与理研 AIP

日本学术界的复苏标志,是东京大学松尾豊(Yutaka Matsuo)研究室。

松尾 2002 年博士毕业于东京大学,2014 年起在工学系研究科开设深度学习课程,迅速吸引了大批日本顶级理工科学生。研究室此后孵化了 SmartNews、ABEJA、Preferred Computational Chemistry 等一批 AI 公司,松尾本人在 2023—2025 年成为日本政府 AI 战略的主要顾问。"松尾系"被日本媒体称为"日本 AI 的复兴中心"。

京都大学的 AI 传统更偏理论。鹿岛久嗣团队、松原仁团队在认知科学与机器学习理论上长期深耕。

理化学研究所(RIKEN)2016 年成立"先进智能项目中心"(AIP),由当时的统计数理研究所所长杉山将担任主任,专注数理统计基础与可信 AI。AIP 与文部科学省合作研发的"富岳"超级计算机(Fugaku,2020 年上线,HPL 性能 442 PFlop/s,2020—2022 年蝉联 TOP500 榜首)后来成为日本主权 AI 的硬件基石。

国立研究开发法人产业技术综合研究所(AIST)下属 AIRC(AI Research Center)则承担产学研接口职责,运营 ABCI 超算集群,向日本企业开放算力。

六、大企业转型:丰田 TRI、索尼 AI 与富士通 Fugaku-LLM

2015 年丰田汽车在加州硅谷成立 Toyota Research Institute(TRI),由前 DARPA 项目经理 Gill Pratt 担任 CEO,挖来 MIT、Stanford 多位机器人与机器学习教授。TRI 主攻自动驾驶与家庭机器人;2024 年其展示的 LBM(Large Behavior Model)能让机器人通过观看人类示范学会复杂家务动作。

2020 年索尼成立 Sony AI,在东京、东京大学、纽约、苏黎世、巴塞罗那五地布点。索尼押注三大方向:游戏 AI(与索尼互动娱乐合作 Gran Turismo Sophy,2022 年发表于《Nature》)、影像 AI、烹饪 AI。

富士通在 2024 年 5 月联合东京工业大学、东北大学、理研,基于 Fugaku 训练出 13B 参数的日语大模型 Fugaku-LLM——这是日本第一个使用本国超算从零训练的开源大模型,权重以 Apache 2.0 协议公开。同年日本 NTT 推出 Tsuzumi(小规模日语高效模型),软银与 OpenAI 合作建设 Stargate Japan 数据中心。

日本大企业 AI 的共性是:以制造业、内容业为锚,不追求 GPT 级别的通用大模型,而强调"足以服务我自己业务"的专用模型。这是一种典型的日本式风格——不与硅谷正面争锋,而把 AI 嵌入既有产业链。

七、当代复苏尝试:Sakana AI、Stability AI 日本与 Karakuri

2023 年 7 月,前 Google Brain 东京研究员 David Ha 与 Llion Jones(《Attention Is All You Need》八作者之一)在东京创立 Sakana AI——意为"鱼",象征"群体智能"。Sakana 主张以"演化算法 + 模型合并"替代单一巨型模型路线,2024 年 1 月推出"模型合并"自动化方法 Evolutionary Model Merge,引发 Hugging Face 社区广泛复现。2024 年 9 月完成 2 亿美元 A 轮融资,估值约 15 亿美元,成为日本第一家 AI 独角兽。日本政府在同年将 Sakana 列为"经济安保重要技术"重点支持企业。

Stability AI Japan 2023 年成立东京分部,发布 Japanese Stable Diffusion 与 Japanese InstructBLIP;Rakuten Group 2024 年发布 Rakuten AI 7B 系列;Karakuri(2016 年创立)专注客服对话与日语对齐;ELYZA(2018 年由松尾研究室博士创立,2024 年被 KDDI 收购控股权)则是日语大模型的代表玩家。

这些公司加在一起,仍然不能与硅谷或中国头部抗衡,但它们让"日本 AI"重新成为一个有公司、有产品、有融资节奏的活态生态。

八、文化、监管与少子化驱动

日本 AI 还有一道独特的护城河——版权法第 30 条之 4(著作权法第 30 条の 4)。

2018 年修订生效的这一条款规定:为机器学习等"非享受性使用"目的而对作品进行处理,可不经作者许可。这条法律使日本成为全球少数对 AI 训练数据持极宽松立场的发达国家之一。许多西方公司因此在日本搭建训练数据流水线。然而 2024—2025 年随着生成式 AI 应用普及,国内插画师群体强烈抗议,文化厅多次召开听证会,是否引入"风格保护"条款仍在博弈。

人口因素则把 AI 与机器人推到日本的国家命题层面。2024 年日本 65 岁以上人口占比超过 29%,制造业、护理业、便利店、出租车均面临严重劳动力缺口。从 2023 年起,日本政府公开把"AI + 机器人"列为缓解少子化的核心政策工具,每年新增数千亿日元财政投入。京瓷推出的护理机器人、罗森便利店的自动收银、富士通的工厂视觉检测——这些应用没有 ChatGPT 般的话题性,但每一个都对应一个被现实逼出来的需求。

日本 AI 的故事,是一个错过又追赶、谦逊又务实的故事。它不喜欢"奇点"叙事,更愿意问一个朴素的问题——这台机器能否帮一位八十岁的老人安全地洗个澡?


太史公曰

余观日本 AI 五十年史,最可叹者非其失,而其得。第五代计算机十年八亿,渕一博 押注一种范式而世界选择另一种——后世多以此例为国家级科研豪赌之反面教材。然第五代之失败,并未消磨日本机器人之传统:WABOT 走在前,ASIMO 接其踵,发那科与安川默默供养全球工厂。深度学习之兴,日本错失十年,PFN 一脉单传,松尾一系晚立门户,至 Sakana 创立方才稍有起色。然日本之复苏,路径与美中皆异——不争通用大模型之锋,而以制造、护理、内容为本,把 AI 嵌入产业之每一环。版权法之宽容,少子化之逼迫,机器人之文化亲和——三股暗流共同支撑着一个被严重低估的 AI 国家。司马迁曰"善始者实繁,克终者盖寡",日本 AI 善始于 1973 年的 WABOT,险些克终于 1992 年的 ICOT;今日重启炉灶,能否克终,全看其是否愿意把"机器服务于人"的传统坚持到底——而非追随他人去造一个"取代人"的神。

亲历者说

征集中

如果你曾在日本参与 AI 研究或机器人开发,欢迎提交贡献

参考资料

  1. Kato, I. (1973). Development of WABOT-1. Biomechanism, 2, 173-214.
  2. Furukawa, K., & Fuchi, K. (1986). Knowledge information processing in Japan. AI Magazine, 7(3), 14-21.
  3. Pollack, A. (1992, June 5). Fifth Generation became Japan's lost generation. The New York Times.
  4. Tokui, S., Oono, K., Hido, S., & Clayton, J. (2015). Chainer: A next-generation open source framework for deep learning. NeurIPS Workshop.
  5. Akiba, T., et al. (2019). Optuna: A next-generation hyperparameter optimization framework. KDD.
  6. RIKEN AIP. (2024). Annual Report 2024. Tokyo.
  7. Wurman, P. R., et al. (2022). Outracing champion Gran Turismo drivers with deep reinforcement learning. Nature, 602, 223-228.
  8. Sakana AI. (2024). Evolutionary Optimization of Model Merging Recipes. arXiv:2403.13187.
  9. 著作権法第 30 条の 4(情報解析のための利用). (2018 年改正).