书 · 中国 AI 发展史

中国 AI 的故事，是一段从追赶到并跑、再到部分领跑的历程。它起步于 1980 年代的计划色彩，成长于 BAT 的搜索与广告，爆发于 2014 年之后的 CV 四小龙与大模型六小虎，并在 2025 年的 DeepSeek R1 时刻第一次让世界认真审视"中国式 AI"的可能性。在算力封锁与制度差异的双重束缚下，它走出了一条与美国并行却风格不同的路径。

一、起源：863 计划与"先生派"（1986—2000）

1986 年 3 月，王大珩、王淦昌、陈芳允、杨嘉墀四位老科学家联名上书，建议中国加速发展高技术。同月邓小平批示，中国版"高技术研究发展计划"——"863 计划"正式启动。智能计算机（306 主题）是其中之一，从此 AI 进入国家议程。

那一代被称作"先生派"的学者把第一批种子埋下：清华大学的张钹院士在 1980 年代初推动智能机器人研究，提出"商空间"理论；中科院自动化所的戴汝为院士、陆汝钤院士分别在模式识别与知识表示领域奠基；哈工大的方滨兴、李生在中文信息处理与语音识别上深耕；南京大学的周志华（周志华）则在 2000 年代之后以集成学习与机器学习教材成为最具国际声誉的中国 AI 学者之一。

那是一段"经费紧、设备缺、出国难"的岁月，但它确立了一个延续至今的传统——中国 AI 的母体在大学与国家实验室之间，而非企业。

二、1990 年代：院系扎根

1996—2000 年间，国内主要高校先后成立独立的计算机系或人工智能方向。清华自 1985 年设立计算机系智能技术与系统国家重点实验室；中国科学院计算技术研究所与自动化研究所长期主导符号 AI 与模式识别；哈工大 1956 年即创办计算机专业，是中文语音识别的发祥地；北大、复旦、上交、浙大、西安交大也各自形成 AI 团队。

南京大学的周志华团队在 2000 年代后期通过 ICML、NeurIPS、AAAI 等顶会论文真正打开了国际声誉；他的《机器学习》教材（俗称"西瓜书"，2016 年）此后教化了整整一代中国机器学习入门者。在这十年里，李开复主政的微软亚洲研究院（MSRA，1998 年成立于北京）几乎一手训练了未来 BAT 与 CV 四小龙的全部核心骨干——汤晓鸥、孙剑、何凯明（何恺明）、王坚、林斌皆出自此间。MSRA 被业界称为"中国 AI 的黄埔军校"，名副其实。

三、早期产业：科大讯飞、汉王、海康威视

中国 AI 最早的产业化样本，来自三家被低估的公司。

1999 年，刘庆峰带领中科大语音实验室的 18 位研究生在合肥创办科大讯飞，主攻中文语音合成与识别。它在中小学英语听说测评、政府会议转录等垂直市场磨砺二十年，2008 年深交所上市，成为中国第一家以 AI 为核心业务的上市公司。同期的汉王科技深耕手写识别与 OCR，2010 年以电子书短暂登顶 A 股；海康威视则从模拟监控起步，借助深度学习浪潮在 2014 年后转型为全球最大的视频 AI 厂商之一。

这三家公司没有"硅谷叙事"的光环，但它们为中国 AI 积累了第一批工程经验、第一批客户合同与第一批政府关系——这三样东西，比模型本身更难复制。

四、BAT 时代：搜索、电商与社交里的 AI

如果说美国 AI 的产业母体是 Google，那么中国 AI 的产业母体是 BAT。

百度在 2014 年招聘吴恩达担任首席科学家，在硅谷设立深度学习实验室（IDL）。吴恩达虽然 2017 年离开，但 IDL 期间训练并输出了一大批人才——包括王劲、余凯、林元庆、林斌等——他们后来分别成为地平线、Pony.ai、智源研究院、Mobvoi 等公司的核心。百度自身则把搜索、地图、Apollo 自动驾驶、文心系列大模型一路推到 2023 年的"文心一言"。

阿里巴巴的 AI 主力军是达摩院（2017 年成立）与通义实验室。2023 年开始，通义千问（Qwen）系列以"中国最积极开源的大厂模型"姿态崛起，2024—2025 年其 Qwen2、Qwen2.5、Qwen3 系列在 Hugging Face 月下载量长期位居开源榜首，与 Meta 的 Llama 平分秋色。

腾讯的优图实验室专注计算机视觉，AI Lab 则覆盖语音、NLP 与游戏 AI；微信的智能客服与 QQ 浏览器的内容理解，都是其早期落地场景。腾讯 2023 年发布混元大模型，2024 年开源 Hunyuan-Large。

BAT 三家共同的特点是：业务即数据，数据即燃料。它们没有像 OpenAI 那样押注 AGI，但它们让 AI 成为日常应用的水电煤。

五、CV 四小龙：黄金期、上市潮与退潮（2014—2024）

2014—2018 年是中国 AI 的"视觉时代"。

商汤科技（2014 年由汤晓鸥与徐立创立于香港）、旷视科技（Megvii，2011 年由印奇、唐文斌、杨沐创立于北京）、依图科技（2012 年由朱珑、林晨曦创立于上海）、云从科技（2015 年由周曦剥离自中科院重庆院）——这四家被资本称为 CV 四小龙的公司，在四年间累计融资超过 100 亿美元，估值峰值各自突破百亿美元，业务覆盖人脸识别、安防、金融身份核验与城市大脑。

2019 年起，这条赛道的天花板逐渐显形。美国实体清单将商汤、旷视、依图等公司纳入名单，海外算力与上市通道收紧。2021—2022 年的港股上市潮虽然惊险完成（商汤 2021 年港交所上市），但股价与估值迅速回落。2023—2024 年随着大模型崛起，纯视觉范式被进一步边缘化，"CV 四小龙"作为一个集体概念逐渐淡出语境，剩下的故事是各自分化——商汤押注大装置，旷视坚守 IoT 视觉，依图收缩，云从转向行业大模型。

这是一次完整的产业周期，留下的不只是教训，也是中国 AI 第一批真正大规模训练神经网络的工程班底。

六、大模型时代：国产六小虎

2023 年下半年起，中国大模型创业进入井喷期。被媒体称为"大模型六小虎"的六家初创公司，分别是：

智谱 AI（2019 年成立，清华系）：GLM 系列大模型，2024 年估值约 200 亿元人民币，2025 年继续推进 GLM-5；
月之暗面（Moonshot AI，2023 年杨植麟创立）：Kimi 系列以超长上下文（200 万字）打开消费市场，C 端用户增长一度超过国内所有竞争者；
MiniMax（2021 年闫俊杰创立）：海螺 AI 与 abab 系列，B 端 API 与海外版"Talkie"双线并行；
百川智能（2023 年王小川创立）：Baichuan 系列以开源策略迅速覆盖学界；
零一万物（01.AI，2023 年由李开复创立）：Yi 系列在英文基准测试中一度对标 Llama 2 70B；
阶跃星辰（2023 年姜大昕创立）：Step 系列主打多模态。

这六家公司在 2023—2024 年累计融资超过 100 亿美元。它们的共同特征是：创始人多有 BAT 或 MSRA 背景、估值在 200 亿—500 亿元人民币之间、英文媒体长期关注度有限。但它们组成了中国第一批专注大模型的"创业 AI 集团"。

七、字节、阿里与 DeepSeek 的崛起（2024—2025）

2024 年起，大模型战场出现两股新势力。

字节跳动以"豆包"（Doubao）后发制人。借助抖音流量，豆包在 2024 年下半年迅速成为国内 MAU 最大的 AI 助手；其 Seedance、Seed1.5 系列模型与 Volcano Engine 算力捆绑销售。阿里通义在前述开源策略下持续巩固开发者基本盘。腾讯则把混元嵌入微信、QQ 与企业微信。

但真正震动全球的，是 DeepSeek。

幻方量化旗下的深度求索（DeepSeek）2023 年才成立。2024 年 12 月发布 DeepSeek-V3（671B 参数 MoE），训练成本被宣称仅 558 万美元，在海外引起广泛质疑与好奇。2025 年 1 月，DeepSeek-R1 发布并开源，性能在多项推理基准上对标 OpenAI o1，引发"DeepSeek 时刻"——纳斯达克 NVIDIA 单日跌幅创历史纪录，硅谷头部公司召开紧急复盘会。R1 的意义不只是性能，更是范式：以 H800 在算力封锁下做到接近 H100 的训练效率，并以 MIT 许可开源全部权重与训练细节，把"开源大模型"重新推上世界舞台。

2025 年下半年，DeepSeek-V3.2、R2 系列继续跟进，公司被《时代》评为"年度最有影响力 AI 公司"之一。

八、中美 AI 脱钩：实体清单与算力封锁

2018 年以来，美国对中国 AI 的限制在不断升级。

2019 年 10 月，商务部首次将商汤、旷视、依图、海康威视、科大讯飞等 28 家中国实体纳入清单。2022 年 10 月 BIS 出台先进半导体出口管制，A100/H100 禁运。2023 年 10 月规则收紧、特供版 A800/H800 也被堵死。2024 年 12 月新规扩展至 HBM 高带宽内存与晶圆设备。2025 年特朗普第二任期延续并加码，将"AI 扩散规则"分级管制全球算力流向。

中国的应对是双轨：一方面以华为昇腾 910B/910C、寒武纪思元 590、摩尔线程 MTT S4000、海光、燧原、壁仞等国产芯片填补缺口；另一方面，DeepSeek 等公司证明在算力受限下仍可逼近顶级模型。短期阵痛是真实的，长期效果尚未盖棺。

九、国产算力基建：从"卡脖子"到"换体系"

2024—2026 年，中国 AI 算力的国产化进入实质阶段。

华为昇腾在 2024 年发布 910C，单卡性能已接近 H100 的 60%；其 CloudMatrix 384 集群被宣传为"以系统对抗单卡"。寒武纪 2024 年扭亏为盈，思元 590 大批量供货百度、字节。摩尔线程从游戏 GPU 切入大模型训练，2025 年完成科创板过会。中科曙光、海光信息组成的"中科系"承担超算与 AI 服务器双线任务。

软件栈层面，PaddlePaddle（飞桨，百度）、MindSpore（昇思，华为）、OneFlow（一流，被字节收编）尝试替代 PyTorch；模型层面，Qwen、DeepSeek、GLM、InternLM、Kimi 在 Hugging Face 与 ModelScope 双发。一个独立但仍未闭环的中国 AI 技术栈正在成形。

十、政策驱动与市场驱动的双轨

中国 AI 的最大特点，是它从来不是一个纯粹的市场故事。

2017 年国务院《新一代人工智能发展规划》提出"三步走"战略，目标到 2030 年成为世界主要 AI 创新中心。2024 年的《政府工作报告》首次写入"人工智能 +"行动；同年北京、上海、深圳、合肥、杭州、成都纷纷推出本地大模型补贴与算力券。地方政府的"算力券"模式，本质是把 GPU 时段当作产业政策工具发放给创业公司。

这种政策与市场的双轨，既造就了中国 AI 的速度，也带来了它特有的风险——估值由政策周期共振、资源向头部公司过度集中、长期基础研究投入相对不足。但站在 2026 年，中国 AI 已经不再是"美国之后的跟随者"，而是一个有自己技术栈、自己叙事、自己市场的并行体系。

太史公曰

余观中国 AI 四十年史，慨然有得。1986 年四老上书之时，国中尚无几台像样计算机，而今日 DeepSeek 一出，纳斯达克为之震动——此非一日之功，乃数代人之厚积。然其路径与美国大异：美国 AI 起于学术，长于资本，成于市场；中国 AI 起于国家，长于业务，成于政策与市场之双轨。BAT 借搜索与电商把 AI 工程师批量培养成军；CV 四小龙借安防与金融把视觉模型推到工程极限；六小虎与 DeepSeek 借开源与算力极限优化把"中国式效率"写在了世界的论文里。然此中亦有隐忧：估值随政策起落，研究随产品节拍，长周期、低回报、高风险的基础工作往往无人问津。司马迁曰"通古今之变"，AI 之变正在眼前——封锁愈紧、突围愈烈，但封锁能催生奇兵，亦能消磨耐心。能否在被压力倒逼出 R1 时刻之外，再造出本土的"达特茅斯会议"——一群人无功利地坐下来，问一个未来才有用的问题——此乃中国 AI 由并跑而至领跑之分水岭。

亲历者说

征集中

如果你曾在中国 AI 学术界或产业界亲历这段历史，欢迎提交贡献。

参考资料

国务院. (2017). 《新一代人工智能发展规划》. 国发〔2017〕35 号.
周志华. (2016). 《机器学习》. 清华大学出版社.
中国信息通信研究院. (2024). 《人工智能发展白皮书 2024》.
DeepSeek-AI. (2024). DeepSeek-V3 Technical Report. arXiv:2412.19437.
DeepSeek-AI. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948.
Alibaba Qwen Team. (2024). Qwen2 Technical Report. arXiv:2407.10671.
U.S. Department of Commerce, BIS. (2022—2024). Export Controls on Advanced Computing and Semiconductor Items.
Lee, K.-F. (2018). AI Superpowers: China, Silicon Valley, and the New World Order. Houghton Mifflin Harcourt.

书 · 中国 AI 发展史 ​

一、起源：863 计划与"先生派"（1986—2000） ​

二、1990 年代：院系扎根 ​

三、早期产业：科大讯飞、汉王、海康威视 ​

四、BAT 时代：搜索、电商与社交里的 AI ​

五、CV 四小龙：黄金期、上市潮与退潮（2014—2024） ​

六、大模型时代：国产六小虎 ​

七、字节、阿里与 DeepSeek 的崛起（2024—2025） ​

八、中美 AI 脱钩：实体清单与算力封锁 ​

九、国产算力基建：从"卡脖子"到"换体系" ​

十、政策驱动与市场驱动的双轨 ​

亲历者说 ​

参考资料 ​