书 · 日本 AI 发展史
第五代计算机计划是 AI 历史上最昂贵的一次国家级豪赌,它的失败把日本推入"失落的三十年"AI 叙事。然而日本机器人传统从未中断,深度学习时代它又以 Preferred Networks、Sakana AI、Sony AI 等公司悄然回到牌桌。少子化的人口压力、对版权的宽松法律解释、对机器人的文化亲和——三股暗流支撑着一个被低估的 AI 国家。
一、战后机器人传统:从 WABOT 到 ASIMO
日本 AI 的第一段叙事,不在算法,而在身体。
1973 年,早稻田大学的加藤一郎教授团队完成 WABOT-1 的研制——这是世界上第一台全尺寸人形机器人,能用人造嘴说简单日语,用机械手抓取物体,用双腿缓慢走动。1980 年的 WABOT-2 进一步会读乐谱并演奏电子琴。加藤被尊为"人形机器人之父",他奠定的研究范式延续至今——日本 AI 的关注点是"如何让机器与人共处",而不是"如何让机器超越人"。
1986 年,本田汽车在京都的一家秘密实验室启动人形机器人项目。1996 年第一代 P2 公开亮相时全场震惊:一台 1.82 米高、210 公斤重的机器人,竟然能够稳定地双足行走。2000 年,本田发布更小巧的 ASIMO(Advanced Step in Innovative Mobility),身高 1.3 米,能上下楼梯、辨认人脸、奔跑、踢足球。ASIMO 在 22 年里巡演全球,被联合国请上演讲台,被奥巴马接见,2022 年正式退役。它的退役不是失败——而是日本机器人产业把人形机器人交还给学术界与新一代创业者(如 Boston Dynamics、Figure、特斯拉 Optimus)的一个仪式性瞬间。
工业机器人领域,"四大家族"中两家来自日本——发那科(Fanuc,1972 年从富士通独立)与安川电机(Yaskawa,1915 年创立)。它们与 ABB(瑞士)、库卡(德国,2016 年被美的收购)共同瓜分全球工业机器人市场。截至 2024 年,全球 38% 的工业机器人由日本厂商制造,远高于其他任何国家。这是一种沉默而扎实的优势。
二、第五代计算机计划:辉煌与失败(1982—1992)
1982 年,日本通商产业省(MITI,今经济产业省 METI)宣布启动"第五代计算机计划"(Fifth Generation Computer Systems Project, FGCS),由 渕一博 担任 ICOT(新一代计算机技术研究所)所长。十年预算 8.5 亿美元,目标是用并行逻辑编程和符号推理打造下一代"知识信息处理"计算机。
这个计划在国际上引发的恐慌远超日本预期。美国国会迅速通过《国家合作研究法》解除反垄断限制,DARPA 启动战略计算计划(10 亿美元),微电子与计算机技术公司(MCC)应运而生;英国成立 Alvey 计划,欧共体启动 ESPRIT。一时间整个西方都担心日本要在 AI 上完成"第二次半导体奇袭"。
ICOT 在十年里训练出三百多名研究员,开发了基于 Prolog 衍生语言 KL1 的并行推理机 PIM/p、PIM/m、Multi-PSI 等十余款机器,发表论文数千篇。但站在 1992 年项目结束时回看,结果令人尴尬:硬件性能未达商业级,并行逻辑编程范式被工业界冷落,神经网络与统计机器学习正在全球抬头。渕一博 在结项报告中坦言:"我们押注了一种范式,而世界选择了另一种。"
第五代计算机的失败成为日本 AI 史的分水岭。它一方面塑造了"政府主导、长期投入"的资助文化,另一方面也让此后二十年日本对 AI 国家级项目格外谨慎——这种谨慎,恰好让日本错过了深度学习的早期波浪。详见《世家·ICOT》。
三、失落的三十年:错过深度学习浪潮
1990 年代后半到 2010 年代初,是日本 AI 学术与产业最沉默的二十年。
原因复杂。第五代失败造成的"AI 冬季叙事"使政府与企业回避大规模 AI 项目;泡沫经济破灭后日本企业全面转向"成本控制";学术界因终身教职制度刚性、英语能力相对薄弱,国际顶会论文份额持续下滑。1995 年到 2012 年间,日本研究者在 NeurIPS、ICML 上的论文份额从 8% 降到 2%。当 ImageNet 2012 引爆深度学习时,日本几乎没有任何一支可与多伦多、纽约、Google Brain 抗衡的工业研究团队。
这段失落期被一句日本科技圈广泛流传的话精准概括:"世界变了,我们没变。"
四、Preferred Networks:从 Chainer 到工业 AI
变局始于 2014 年。
岡野原大輔与西川徹两位东京大学博士毕业生,于 2008 年共同创立 Preferred Infrastructure(PFI),主攻分布式数据库与大规模文本处理。2014 年他们剥离 AI 团队成立 Preferred Networks(PFN),把方向押注在深度学习与工业应用。
PFN 留给世界的最重要产物是 Chainer——2015 年开源的深度学习框架,首次提出"按运行定义计算图"(define-by-run)的动态图思路。这一设计后来被 PyTorch 完全继承,成为现代深度学习框架的事实标准。Chainer 在 2019 年宣布迁移到 PyTorch,PFN 把"框架战争"让给了硅谷,转而专注垂直应用。
PFN 此后与丰田合作研发自动驾驶感知系统、与 FANUC 合作工厂智能机械臂、与三菱化学合作分子模拟。2018 年它推出 Optuna——开源超参数自动调优库,至今仍是最广泛使用的 Python 调参工具之一。2024 年 PFN 发布 PLaMo(PFN Large Model)系列日语大模型,与日本厚生劳动省合作建立医疗大模型。
PFN 几乎是日本 AI 产业一个独特的参考样本:技术上对标硅谷,但坚持留在东京、坚持服务日本制造业。它在 2024 年估值约 35 亿美元,是日本最具影响力的 AI 创业公司。
五、学术:松尾研究室、京大与理研 AIP
日本学术界的复苏标志,是东京大学松尾豊(Yutaka Matsuo)研究室。
松尾 2002 年博士毕业于东京大学,2014 年起在工学系研究科开设深度学习课程,迅速吸引了大批日本顶级理工科学生。研究室此后孵化了 SmartNews、ABEJA、Preferred Computational Chemistry 等一批 AI 公司,松尾本人在 2023—2025 年成为日本政府 AI 战略的主要顾问。"松尾系"被日本媒体称为"日本 AI 的复兴中心"。
京都大学的 AI 传统更偏理论。鹿岛久嗣团队、松原仁团队在认知科学与机器学习理论上长期深耕。
理化学研究所(RIKEN)2016 年成立"先进智能项目中心"(AIP),由当时的统计数理研究所所长杉山将担任主任,专注数理统计基础与可信 AI。AIP 与文部科学省合作研发的"富岳"超级计算机(Fugaku,2020 年上线,HPL 性能 442 PFlop/s,2020—2022 年蝉联 TOP500 榜首)后来成为日本主权 AI 的硬件基石。
国立研究开发法人产业技术综合研究所(AIST)下属 AIRC(AI Research Center)则承担产学研接口职责,运营 ABCI 超算集群,向日本企业开放算力。
六、大企业转型:丰田 TRI、索尼 AI 与富士通 Fugaku-LLM
2015 年丰田汽车在加州硅谷成立 Toyota Research Institute(TRI),由前 DARPA 项目经理 Gill Pratt 担任 CEO,挖来 MIT、Stanford 多位机器人与机器学习教授。TRI 主攻自动驾驶与家庭机器人;2024 年其展示的 LBM(Large Behavior Model)能让机器人通过观看人类示范学会复杂家务动作。
2020 年索尼成立 Sony AI,在东京、东京大学、纽约、苏黎世、巴塞罗那五地布点。索尼押注三大方向:游戏 AI(与索尼互动娱乐合作 Gran Turismo Sophy,2022 年发表于《Nature》)、影像 AI、烹饪 AI。
富士通在 2024 年 5 月联合东京工业大学、东北大学、理研,基于 Fugaku 训练出 13B 参数的日语大模型 Fugaku-LLM——这是日本第一个使用本国超算从零训练的开源大模型,权重以 Apache 2.0 协议公开。同年日本 NTT 推出 Tsuzumi(小规模日语高效模型),软银与 OpenAI 合作建设 Stargate Japan 数据中心。
日本大企业 AI 的共性是:以制造业、内容业为锚,不追求 GPT 级别的通用大模型,而强调"足以服务我自己业务"的专用模型。这是一种典型的日本式风格——不与硅谷正面争锋,而把 AI 嵌入既有产业链。
七、当代复苏尝试:Sakana AI、Stability AI 日本与 Karakuri
2023 年 7 月,前 Google Brain 东京研究员 David Ha 与 Llion Jones(《Attention Is All You Need》八作者之一)在东京创立 Sakana AI——意为"鱼",象征"群体智能"。Sakana 主张以"演化算法 + 模型合并"替代单一巨型模型路线,2024 年 1 月推出"模型合并"自动化方法 Evolutionary Model Merge,引发 Hugging Face 社区广泛复现。2024 年 9 月完成 2 亿美元 A 轮融资,估值约 15 亿美元,成为日本第一家 AI 独角兽。日本政府在同年将 Sakana 列为"经济安保重要技术"重点支持企业。
Stability AI Japan 2023 年成立东京分部,发布 Japanese Stable Diffusion 与 Japanese InstructBLIP;Rakuten Group 2024 年发布 Rakuten AI 7B 系列;Karakuri(2016 年创立)专注客服对话与日语对齐;ELYZA(2018 年由松尾研究室博士创立,2024 年被 KDDI 收购控股权)则是日语大模型的代表玩家。
这些公司加在一起,仍然不能与硅谷或中国头部抗衡,但它们让"日本 AI"重新成为一个有公司、有产品、有融资节奏的活态生态。
八、文化、监管与少子化驱动
日本 AI 还有一道独特的护城河——版权法第 30 条之 4(著作权法第 30 条の 4)。
2018 年修订生效的这一条款规定:为机器学习等"非享受性使用"目的而对作品进行处理,可不经作者许可。这条法律使日本成为全球少数对 AI 训练数据持极宽松立场的发达国家之一。许多西方公司因此在日本搭建训练数据流水线。然而 2024—2025 年随着生成式 AI 应用普及,国内插画师群体强烈抗议,文化厅多次召开听证会,是否引入"风格保护"条款仍在博弈。
人口因素则把 AI 与机器人推到日本的国家命题层面。2024 年日本 65 岁以上人口占比超过 29%,制造业、护理业、便利店、出租车均面临严重劳动力缺口。从 2023 年起,日本政府公开把"AI + 机器人"列为缓解少子化的核心政策工具,每年新增数千亿日元财政投入。京瓷推出的护理机器人、罗森便利店的自动收银、富士通的工厂视觉检测——这些应用没有 ChatGPT 般的话题性,但每一个都对应一个被现实逼出来的需求。
日本 AI 的故事,是一个错过又追赶、谦逊又务实的故事。它不喜欢"奇点"叙事,更愿意问一个朴素的问题——这台机器能否帮一位八十岁的老人安全地洗个澡?
太史公曰
余观日本 AI 五十年史,最可叹者非其失,而其得。第五代计算机十年八亿,渕一博 押注一种范式而世界选择另一种——后世多以此例为国家级科研豪赌之反面教材。然第五代之失败,并未消磨日本机器人之传统:WABOT 走在前,ASIMO 接其踵,发那科与安川默默供养全球工厂。深度学习之兴,日本错失十年,PFN 一脉单传,松尾一系晚立门户,至 Sakana 创立方才稍有起色。然日本之复苏,路径与美中皆异——不争通用大模型之锋,而以制造、护理、内容为本,把 AI 嵌入产业之每一环。版权法之宽容,少子化之逼迫,机器人之文化亲和——三股暗流共同支撑着一个被严重低估的 AI 国家。司马迁曰"善始者实繁,克终者盖寡",日本 AI 善始于 1973 年的 WABOT,险些克终于 1992 年的 ICOT;今日重启炉灶,能否克终,全看其是否愿意把"机器服务于人"的传统坚持到底——而非追随他人去造一个"取代人"的神。
亲历者说
征集中
如果你曾在日本参与 AI 研究或机器人开发,欢迎提交贡献。
参考资料
- Kato, I. (1973). Development of WABOT-1. Biomechanism, 2, 173-214.
- Furukawa, K., & Fuchi, K. (1986). Knowledge information processing in Japan. AI Magazine, 7(3), 14-21.
- Pollack, A. (1992, June 5). Fifth Generation became Japan's lost generation. The New York Times.
- Tokui, S., Oono, K., Hido, S., & Clayton, J. (2015). Chainer: A next-generation open source framework for deep learning. NeurIPS Workshop.
- Akiba, T., et al. (2019). Optuna: A next-generation hyperparameter optimization framework. KDD.
- RIKEN AIP. (2024). Annual Report 2024. Tokyo.
- Wurman, P. R., et al. (2022). Outracing champion Gran Turismo drivers with deep reinforcement learning. Nature, 602, 223-228.
- Sakana AI. (2024). Evolutionary Optimization of Model Merging Recipes. arXiv:2403.13187.
- 著作権法第 30 条の 4(情報解析のための利用). (2018 年改正).