书 · 中国 AI 发展史
中国 AI 的故事,是一段从追赶到并跑、再到部分领跑的历程。它起步于 1980 年代的计划色彩,成长于 BAT 的搜索与广告,爆发于 2014 年之后的 CV 四小龙与大模型六小虎,并在 2025 年的 DeepSeek R1 时刻第一次让世界认真审视"中国式 AI"的可能性。在算力封锁与制度差异的双重束缚下,它走出了一条与美国并行却风格不同的路径。
一、起源:863 计划与"先生派"(1986—2000)
1986 年 3 月,王大珩、王淦昌、陈芳允、杨嘉墀四位老科学家联名上书,建议中国加速发展高技术。同月邓小平批示,中国版"高技术研究发展计划"——"863 计划"正式启动。智能计算机(306 主题)是其中之一,从此 AI 进入国家议程。
那一代被称作"先生派"的学者把第一批种子埋下:清华大学的张钹院士在 1980 年代初推动智能机器人研究,提出"商空间"理论;中科院自动化所的戴汝为院士、陆汝钤院士分别在模式识别与知识表示领域奠基;哈工大的方滨兴、李生在中文信息处理与语音识别上深耕;南京大学的周志华(周志华)则在 2000 年代之后以集成学习与机器学习教材成为最具国际声誉的中国 AI 学者之一。
那是一段"经费紧、设备缺、出国难"的岁月,但它确立了一个延续至今的传统——中国 AI 的母体在大学与国家实验室之间,而非企业。
二、1990 年代:院系扎根
1996—2000 年间,国内主要高校先后成立独立的计算机系或人工智能方向。清华自 1985 年设立计算机系智能技术与系统国家重点实验室;中国科学院计算技术研究所与自动化研究所长期主导符号 AI 与模式识别;哈工大 1956 年即创办计算机专业,是中文语音识别的发祥地;北大、复旦、上交、浙大、西安交大也各自形成 AI 团队。
南京大学的周志华团队在 2000 年代后期通过 ICML、NeurIPS、AAAI 等顶会论文真正打开了国际声誉;他的《机器学习》教材(俗称"西瓜书",2016 年)此后教化了整整一代中国机器学习入门者。在这十年里,李开复 主政的微软亚洲研究院(MSRA,1998 年成立于北京)几乎一手训练了未来 BAT 与 CV 四小龙的全部核心骨干——汤晓鸥、孙剑、何凯明(何恺明)、王坚、林斌皆出自此间。MSRA 被业界称为"中国 AI 的黄埔军校",名副其实。
三、早期产业:科大讯飞、汉王、海康威视
中国 AI 最早的产业化样本,来自三家被低估的公司。
1999 年,刘庆峰带领中科大语音实验室的 18 位研究生在合肥创办科大讯飞,主攻中文语音合成与识别。它在中小学英语听说测评、政府会议转录等垂直市场磨砺二十年,2008 年深交所上市,成为中国第一家以 AI 为核心业务的上市公司。同期的汉王科技深耕手写识别与 OCR,2010 年以电子书短暂登顶 A 股;海康威视则从模拟监控起步,借助深度学习浪潮在 2014 年后转型为全球最大的视频 AI 厂商之一。
这三家公司没有"硅谷叙事"的光环,但它们为中国 AI 积累了第一批工程经验、第一批客户合同与第一批政府关系——这三样东西,比模型本身更难复制。
四、BAT 时代:搜索、电商与社交里的 AI
如果说美国 AI 的产业母体是 Google,那么中国 AI 的产业母体是 BAT。
百度在 2014 年招聘 吴恩达 担任首席科学家,在硅谷设立深度学习实验室(IDL)。吴恩达 虽然 2017 年离开,但 IDL 期间训练并输出了一大批人才——包括王劲、余凯、林元庆、林斌等——他们后来分别成为地平线、Pony.ai、智源研究院、Mobvoi 等公司的核心。百度自身则把搜索、地图、Apollo 自动驾驶、文心系列大模型一路推到 2023 年的"文心一言"。
阿里巴巴的 AI 主力军是达摩院(2017 年成立)与通义实验室。2023 年开始,通义千问(Qwen)系列以"中国最积极开源的大厂模型"姿态崛起,2024—2025 年其 Qwen2、Qwen2.5、Qwen3 系列在 Hugging Face 月下载量长期位居开源榜首,与 Meta 的 Llama 平分秋色。
腾讯的优图实验室专注计算机视觉,AI Lab 则覆盖语音、NLP 与游戏 AI;微信的智能客服与 QQ 浏览器的内容理解,都是其早期落地场景。腾讯 2023 年发布混元大模型,2024 年开源 Hunyuan-Large。
BAT 三家共同的特点是:业务即数据,数据即燃料。它们没有像 OpenAI 那样押注 AGI,但它们让 AI 成为日常应用的水电煤。
五、CV 四小龙:黄金期、上市潮与退潮(2014—2024)
2014—2018 年是中国 AI 的"视觉时代"。
商汤科技(2014 年由汤晓鸥与徐立创立于香港)、旷视科技(Megvii,2011 年由印奇、唐文斌、杨沐创立于北京)、依图科技(2012 年由朱珑、林晨曦创立于上海)、云从科技(2015 年由周曦剥离自中科院重庆院)——这四家被资本称为 CV 四小龙的公司,在四年间累计融资超过 100 亿美元,估值峰值各自突破百亿美元,业务覆盖人脸识别、安防、金融身份核验与城市大脑。
2019 年起,这条赛道的天花板逐渐显形。美国实体清单将商汤、旷视、依图等公司纳入名单,海外算力与上市通道收紧。2021—2022 年的港股上市潮虽然惊险完成(商汤 2021 年港交所上市),但股价与估值迅速回落。2023—2024 年随着大模型崛起,纯视觉范式被进一步边缘化,"CV 四小龙"作为一个集体概念逐渐淡出语境,剩下的故事是各自分化——商汤押注大装置,旷视坚守 IoT 视觉,依图收缩,云从转向行业大模型。
这是一次完整的产业周期,留下的不只是教训,也是中国 AI 第一批真正大规模训练神经网络的工程班底。
六、大模型时代:国产六小虎
2023 年下半年起,中国大模型创业进入井喷期。被媒体称为"大模型六小虎"的六家初创公司,分别是:
- 智谱 AI(2019 年成立,清华系):GLM 系列大模型,2024 年估值约 200 亿元人民币,2025 年继续推进 GLM-5;
- 月之暗面(Moonshot AI,2023 年杨植麟创立):Kimi 系列以超长上下文(200 万字)打开消费市场,C 端用户增长一度超过国内所有竞争者;
- MiniMax(2021 年闫俊杰创立):海螺 AI 与 abab 系列,B 端 API 与海外版"Talkie"双线并行;
- 百川智能(2023 年王小川创立):Baichuan 系列以开源策略迅速覆盖学界;
- 零一万物(01.AI,2023 年由 李开复 创立):Yi 系列在英文基准测试中一度对标 Llama 2 70B;
- 阶跃星辰(2023 年姜大昕创立):Step 系列主打多模态。
这六家公司在 2023—2024 年累计融资超过 100 亿美元。它们的共同特征是:创始人多有 BAT 或 MSRA 背景、估值在 200 亿—500 亿元人民币之间、英文媒体长期关注度有限。但它们组成了中国第一批专注大模型的"创业 AI 集团"。
七、字节、阿里与 DeepSeek 的崛起(2024—2025)
2024 年起,大模型战场出现两股新势力。
字节跳动以"豆包"(Doubao)后发制人。借助抖音流量,豆包在 2024 年下半年迅速成为国内 MAU 最大的 AI 助手;其 Seedance、Seed1.5 系列模型与 Volcano Engine 算力捆绑销售。阿里通义在前述开源策略下持续巩固开发者基本盘。腾讯则把混元嵌入微信、QQ 与企业微信。
但真正震动全球的,是 DeepSeek。
幻方量化旗下的深度求索(DeepSeek)2023 年才成立。2024 年 12 月发布 DeepSeek-V3(671B 参数 MoE),训练成本被宣称仅 558 万美元,在海外引起广泛质疑与好奇。2025 年 1 月,DeepSeek-R1 发布并开源,性能在多项推理基准上对标 OpenAI o1,引发"DeepSeek 时刻"——纳斯达克 NVIDIA 单日跌幅创历史纪录,硅谷头部公司召开紧急复盘会。R1 的意义不只是性能,更是范式:以 H800 在算力封锁下做到接近 H100 的训练效率,并以 MIT 许可开源全部权重与训练细节,把"开源大模型"重新推上世界舞台。
2025 年下半年,DeepSeek-V3.2、R2 系列继续跟进,公司被《时代》评为"年度最有影响力 AI 公司"之一。
八、中美 AI 脱钩:实体清单与算力封锁
2018 年以来,美国对中国 AI 的限制在不断升级。
2019 年 10 月,商务部首次将商汤、旷视、依图、海康威视、科大讯飞等 28 家中国实体纳入清单。2022 年 10 月 BIS 出台先进半导体出口管制,A100/H100 禁运。2023 年 10 月规则收紧、特供版 A800/H800 也被堵死。2024 年 12 月新规扩展至 HBM 高带宽内存与晶圆设备。2025 年特朗普第二任期延续并加码,将"AI 扩散规则"分级管制全球算力流向。
中国的应对是双轨:一方面以华为昇腾 910B/910C、寒武纪思元 590、摩尔线程 MTT S4000、海光、燧原、壁仞等国产芯片填补缺口;另一方面,DeepSeek 等公司证明在算力受限下仍可逼近顶级模型。短期阵痛是真实的,长期效果尚未盖棺。
九、国产算力基建:从"卡脖子"到"换体系"
2024—2026 年,中国 AI 算力的国产化进入实质阶段。
华为昇腾在 2024 年发布 910C,单卡性能已接近 H100 的 60%;其 CloudMatrix 384 集群被宣传为"以系统对抗单卡"。寒武纪 2024 年扭亏为盈,思元 590 大批量供货百度、字节。摩尔线程从游戏 GPU 切入大模型训练,2025 年完成科创板过会。中科曙光、海光信息组成的"中科系"承担超算与 AI 服务器双线任务。
软件栈层面,PaddlePaddle(飞桨,百度)、MindSpore(昇思,华为)、OneFlow(一流,被字节收编)尝试替代 PyTorch;模型层面,Qwen、DeepSeek、GLM、InternLM、Kimi 在 Hugging Face 与 ModelScope 双发。一个独立但仍未闭环的中国 AI 技术栈正在成形。
十、政策驱动与市场驱动的双轨
中国 AI 的最大特点,是它从来不是一个纯粹的市场故事。
2017 年国务院《新一代人工智能发展规划》提出"三步走"战略,目标到 2030 年成为世界主要 AI 创新中心。2024 年的《政府工作报告》首次写入"人工智能 +"行动;同年北京、上海、深圳、合肥、杭州、成都纷纷推出本地大模型补贴与算力券。地方政府的"算力券"模式,本质是把 GPU 时段当作产业政策工具发放给创业公司。
这种政策与市场的双轨,既造就了中国 AI 的速度,也带来了它特有的风险——估值由政策周期共振、资源向头部公司过度集中、长期基础研究投入相对不足。但站在 2026 年,中国 AI 已经不再是"美国之后的跟随者",而是一个有自己技术栈、自己叙事、自己市场的并行体系。
太史公曰
余观中国 AI 四十年史,慨然有得。1986 年四老上书之时,国中尚无几台像样计算机,而今日 DeepSeek 一出,纳斯达克为之震动——此非一日之功,乃数代人之厚积。然其路径与美国大异:美国 AI 起于学术,长于资本,成于市场;中国 AI 起于国家,长于业务,成于政策与市场之双轨。BAT 借搜索与电商把 AI 工程师批量培养成军;CV 四小龙借安防与金融把视觉模型推到工程极限;六小虎与 DeepSeek 借开源与算力极限优化把"中国式效率"写在了世界的论文里。然此中亦有隐忧:估值随政策起落,研究随产品节拍,长周期、低回报、高风险的基础工作往往无人问津。司马迁曰"通古今之变",AI 之变正在眼前——封锁愈紧、突围愈烈,但封锁能催生奇兵,亦能消磨耐心。能否在被压力倒逼出 R1 时刻之外,再造出本土的"达特茅斯会议"——一群人无功利地坐下来,问一个未来才有用的问题——此乃中国 AI 由并跑而至领跑之分水岭。
亲历者说
征集中
如果你曾在中国 AI 学术界或产业界亲历这段历史,欢迎提交贡献。
参考资料
- 国务院. (2017). 《新一代人工智能发展规划》. 国发〔2017〕35 号.
- 周志华. (2016). 《机器学习》. 清华大学出版社.
- 中国信息通信研究院. (2024). 《人工智能发展白皮书 2024》.
- DeepSeek-AI. (2024). DeepSeek-V3 Technical Report. arXiv:2412.19437.
- DeepSeek-AI. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948.
- Alibaba Qwen Team. (2024). Qwen2 Technical Report. arXiv:2407.10671.
- U.S. Department of Commerce, BIS. (2022—2024). Export Controls on Advanced Computing and Semiconductor Items.
- Lee, K.-F. (2018). AI Superpowers: China, Silicon Valley, and the New World Order. Houghton Mifflin Harcourt.

