世家 · 百度 AI
中国最早 All in AI 的科技巨头,从搜索引擎到深度学习平台到自动驾驶到大模型,百度的曲折前行勾勒出整整一代中国互联网公司在 AI 上的所有可能与所有遗憾。
一、从超链分析到搜索霸主
2000 年 1 月 1 日,李彦宏(Robin Li)与徐勇(Eric Xu)在北京中关村北大资源宾馆 1414 号房注册了"百度在线网络技术(北京)有限公司"。
"百度"二字典出辛弃疾"众里寻他千百度",是李彦宏自己定的名字。他当时 31 岁,刚从硅谷的 Infoseek 回国,手里攥着一项后来命名为"超链分析"(Hyperlink Analysis)的搜索专利——比 PageRank 早申请,但晚了 Google 两年成型为产品。
百度最初只为门户网站提供搜索服务,2001 年 9 月转型独立搜索引擎 baidu.com。借助比 Google 更熟悉中文分词、更密集的本地化分发,以及 2010 年 Google 退出中国大陆留下的真空,百度在 2010 年代成为中国搜索市场无可争议的霸主,份额一度超过 80%。
在那个移动互联网尚未完全成熟的阶段,"百度一下"几乎成了上网这件事本身的同义词。
但李彦宏在内部很早就意识到,搜索是一个"会被改写"的生意。智能手机让用户的信息入口从浏览器迁移到 App,超级 App(微信、淘宝、抖音)正在围墙起来内容的源头;搜索引擎面对的"被搜索内容",本身在快速变窄。
他在 2013 年的一次内部讲话里说:"互联网的下一幕是人工智能。"
这句话日后被反复引用,也为百度后来的所有动作定调。从这一年开始,"AI" 取代了 "搜索" 成为百度内部全员沟通的高频词。
二、IDL 与吴恩达——硅谷的赌注
2013 年 1 月,百度宣布成立深度学习研究院(IDL,Institute of Deep Learning),由李彦宏亲自挂帅,余凯(前 NEC 美国研究院部门主管)任常务副院长,王海峰、张潼等人组成班底。
这是中国互联网公司第一个以"深度学习"命名的研究机构,比同时期任何中国同行都要早。IDL 的早期成果包括语音识别错误率第一次显著低于 8%、人脸识别在 LFW 上突破 99% 等,使得百度在 2013–2014 年的中国 AI 圈里一度站在最前面。
2014 年 5 月 16 日,百度宣布吴恩达加入,担任首席科学家,主管百度研究院(含北京 IDL、硅谷 Sunnyvale 实验室)。吴恩达在斯坦福、Google Brain、Coursera 之后选择百度,是当年全球 AI 圈最大的人事新闻之一。
他在 Sunnyvale 主持的硅谷 AI 实验室一度聚集了 Adam Coates、林元庆、Bryan Catanzaro 等深度学习与系统方向的明星,做出了 Deep Speech 系列语音识别系统、神经网络机器翻译等成果。Deep Speech 2(2015 年发表于 ICML)首次系统证明了端到端 CTC 架构在中英双语上都能跑赢传统 HMM 流水线,被业界视为深度学习语音识别的里程碑之一。
2017 年 3 月 22 日,吴恩达通过 Medium 公开信宣布离开百度,转向自己的创业项目(Landing AI / deeplearning.ai)。他的离开有多重原因,但从外部观察的角度,与百度内部架构调整、研究院与业务线的协同压力都有关系。
吴恩达离开后,2017 年 1 月加入百度任 COO 的陆奇(前微软全球执行副总裁)成为新的 AI 旗手。陆奇任内确立"All in AI"的口号,砍掉医疗、外卖等非核心业务,把自动驾驶和对话式 AI 提到战略最高级。他还以"DuerOS + Apollo"为两条对外主轴,对应"听得见"和"开得动"两类 AI 能力。
但 2018 年 5 月,陆奇宣布因家庭原因离任,前后只待了 14 个月。
两位旗手相继离去,百度的 AI 故事留下了一段意味深长的空白期,也催生了之后几年关于"百度为何留不住顶级 AI 高管"的反复讨论。
三、Apollo 与飞桨——平台化的两次出手
陆奇任期内最具长期影响的两件事,都发生在 2017 年。
4 月 19 日,百度在上海车展宣布 Apollo 计划,开放其自动驾驶平台与代码、感知数据、仿真环境,对车厂、零部件商和开发者免费开放。这是中国第一个大规模开源的自动驾驶平台,参照了安卓生态的逻辑——百度提供"操作系统",主机厂在上面造车。
截至 2026 年,Apollo 生态合作伙伴已经超过 200 家,其中包括福特、现代、广汽、北汽、奇瑞等。Apollo 的代码量从 2017 年的几十万行扩展到 2024 年的数百万行,是开源社区规模最大的自动驾驶项目之一。
7 月,百度在 AI 开发者大会上正式开源飞桨(PaddlePaddle,"桨"取意"以桨划船"),由王海峰、徐伟(PaddlePaddle 早期负责人)领衔。
飞桨是中国第一个工业级深度学习框架,面向工业界、可大规模分布式训练,是 TensorFlow / PyTorch 之外最早成熟的非美国系框架。十年里,飞桨在中国工业界、教育界落地超过 1500 万开发者,是文心、Apollo 等几乎所有百度自家 AI 业务的底座。
这两件事确立了百度的产业 AI 路径:做平台、做底座、做开源。
这与同时代国内竞品仍以业务驱动的做法形成鲜明对比,也让百度在很长时间里享有"中国 AI 第一"的舆论位置。开源换生态、生态换数据、数据反哺模型——这套思路即便在大模型时代也没有完全过时。
四、ERNIE 与文心一言——大模型时代的先发与失落
在 BERT 引爆预训练语言模型之后,百度迅速跟进。
2019 年 3 月,百度发布 ERNIE 1.0(Enhanced Representation through Knowledge Integration,文心),由王海峰团队主导,首次系统提出"知识增强预训练"——在掩码语言建模之外引入实体级、短语级和知识图谱级掩码,使模型能更好地编码中文实体与世界知识。
ERNIE 在 GLUE / 中文 GLUE 多项任务上击败原版 BERT,是中国第一个被国际学术界广泛引用的预训练大模型工作。此后 ERNIE 2.0(2019)、ERNIE 3.0(2021,100 亿参数)、ERNIE 3.0 Titan(2021,2600 亿参数)连续刷新中文榜单,文心成为百度 NLP 的标志性品牌。
2022 年 11 月 ChatGPT 横空出世,全球 AI 格局重洗。百度的应对速度是中国大厂中最快的。
2023 年 3 月 16 日下午 2 点,李彦宏在北京百度科技园 K2 大楼亲自登台发布文心一言(ERNIE Bot)——中国第一款公开发布、对标 ChatGPT 的对话式大模型产品。
但发布会被广泛批评。李彦宏没有现场互动,演示采用录播回答,技术细节披露有限,发布后股价单日下跌约 6%。中国市场对国产对话大模型的第一印象被这场发布会蒙上了一层阴影。
多位业内人士事后感慨:百度不是输在技术,是输在节奏——前一周才发完,过两个月各家追上来时,发布会的瑕疵反而成了对家最容易引用的材料。
此后百度连续迭代。文心 3.5(2023 年 6 月,宣称推理能力比肩 GPT-3.5)、文心 4.0(2023 年 10 月,李彦宏宣称综合能力"已不输 GPT-4")、文心 4.5(2025 年 3 月,免费开放)、推理增强版文心 X1(2025 年 3 月,对标 DeepSeek-R1 / o1)相继发布。
然而 2024 年起,国内大模型格局已经被阿里通义、字节豆包、月之暗面 Kimi、深度求索 DeepSeek 等多家瓜分,百度的先发优势在通用大模型领域被不断稀释。
文心 4.5 / X1 在 2025 年 3 月宣布免费、6 月宣布开源(基础版本权重以宽松协议发布),是这种压力下的转身——也是百度在十年开源叙事之后回到原点的另一种证明。
五、Apollo Go 与萝卜快跑——把车开上街
百度 AI 真正"走入千家万户"的,反而不是大模型,而是自动驾驶。
2017 年 Apollo 平台开放后,百度同步推进自营 Robotaxi。2020 年 10 月,Apollo Go 在北京海淀区面向公众开放体验;2021 年 5 月在北京首钢园取得国内第一张完全无人驾驶示范运营牌照。2022 年品牌升级为"萝卜快跑"。
2024 年起,萝卜快跑在武汉的大规模商业化引发全国关注——投放车辆超过 400 辆,单日订单量数次刷新中国 Robotaxi 纪录,5 公里内打车价格一度低至 3 至 5 元。
"机器抢出租车司机饭碗"的讨论一度登上微博热搜,地方出租车司机集体请愿的视频也在社交平台流传。这成为中国第一次大规模公开讨论"自动驾驶替代就业"的议题。
截至 2025 年底,萝卜快跑已在北京、武汉、重庆、深圳、上海、广州、长沙、合肥等 10 余个城市常态化运营,累计订单数千万单,是全球与 Waymo 并列的两家完全无人 Robotaxi 商业运营公司。
百度同时推进昆仑芯(Kunlun)AI 加速芯片,从 2018 年昆仑 1 代 FPGA 流片到 2024 年昆仑 3 代量产,构成"芯片—框架—模型—应用"的完整国产 AI 全栈,是国内极少数把这一链条走到商业落地的公司。
六、王海峰、沈抖与一代技术骨干
百度 AI 之所以能在十年里持续输出,靠的不是某一位"明星科学家",而是一批长期主义的技术骨干。
王海峰,CTO,IDL 与文心系列的核心负责人,2010 年加入百度,是飞桨、文心一脉的灵魂工程师,亦是国内自然语言处理领域最早的 ACL Fellow 之一。
沈抖,2024 年起兼任智能云事业群总裁,主导文心商业化与云上 MaaS。马艳军,飞桨现任技术负责人。何中军、肖欣延、何径舟分别在机器翻译、文心、Apollo 方向有长期建树。
陆奇离开后再无空降的"明星 COO",从内部成长起来的工程师群体成为这家公司 AI 战线的真正中坚。这种"技术干部本土化"是百度区别于阿里、字节的鲜明特征:吴恩达、陆奇离开后,公司没有再依赖海外明星挂帅,而是让自己培养的工程师走到台前。
代价是话题度下降,长处是技术路径更稳定。
七、先行者的代价
回望 2013–2026 这十三年,百度是中国互联网巨头中最早把宝押在 AI 上的,也是最早把"All in AI"作为口号的。
它在很多事情上是中国第一:第一个深度学习研究院、第一个工业级开源框架、第一个开源自动驾驶平台、第一个发布的对话大模型、第一个商业化运营的 Robotaxi 城市规模车队。
但"第一"未必意味着"最强"。在通用大模型的牌桌上,2025 年的百度已经被通义、豆包、DeepSeek 反超;在搜索的本业上,AI 改写搜索的浪潮让它的护城河肉眼可见地变窄;股价从 2021 年的高点一路缩水,市值长期徘徊在 300–400 亿美元之间,已被中国互联网"老二之争"边缘化。
李彦宏 2024 年内部信中坦承:"我们曾经的优势,不一定还是优势。"
百度仍是中国 AI 最重要的玩家之一——它的飞桨、Apollo、昆仑芯、萝卜快跑共同构成了中国 AI 工业化最完整的一条产业链。它也是一家被时代反复检验的公司:先发优势能否撑过下一轮洗牌,要看 2026 年之后的故事。
太史公曰
百度之于中国 AI,犹早行之雁,先扇风而后被风。十年之间,先有 IDL,后有 Apollo,再有飞桨,又有文心,凡所开辟,皆为后来者所循。然先行者未必为得利者:吴恩达、陆奇前后去职,文心一言首发受挫,通用大模型为后来居上者所夺。其得在长期:飞桨之于中国深度学习开发者,犹 Linux 之于操作系统;萝卜快跑之于中国出行,犹一桥跨大江。其失在节奏:每一次站到风口最前,反而最早承受风口转向之苦。然技术之事,论数十年而非论一两年——若 2030 之后回望,百度之 All in AI,或终将证明非空言。
亲历者说
征集中
如果你曾在百度 IDL、研究院、飞桨、Apollo、文心或萝卜快跑团队工作,欢迎提交贡献。
参考资料
- 李彦宏(2017)。《智能革命:迎接人工智能时代的社会、经济与文化变革》。中信出版社。
- Hannun, A., Case, C., Casper, J., et al. (2014). "Deep Speech: Scaling up end-to-end speech recognition." arXiv:1412.5567.
- Amodei, D., Anubhai, R., Battenberg, E., et al. (2016). "Deep Speech 2: End-to-End Speech Recognition in English and Mandarin." ICML 2016.
- Sun, Y., Wang, S., Li, Y., et al. (2019). "ERNIE: Enhanced Representation through Knowledge Integration." arXiv:1904.09223.
- Sun, Y., Wang, S., Feng, S., et al. (2021). "ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation." arXiv:2107.02137.
- Ma, Y., Yu, D., Wu, T., & Wang, H. (2019). "PaddlePaddle: An Open-Source Deep Learning Platform from Industrial Practice." Frontiers of Data and Computing, 1(1).
- Andrew Ng. "Opening a new chapter of my work in AI." Medium, March 22, 2017.
- 陆奇(2018 年 5 月 18 日)。"百度内部全员信",腾讯科技、36 氪整理报道。
- Baidu Apollo Open Platform 官方白皮书(2017–2025)。
- 李彦宏(2023 年 3 月 16 日)。"文心一言发布会"现场实录,新华社、第一财经、澎湃新闻报道。
- 36 氪(2024 年 7 月)。《萝卜快跑武汉调查:5 块钱打到的未来》。
- Baidu Inc. Annual Report (Form 20-F),2014–2024 历年。
- 王海峰等(2024)。"文心大模型 4.0 技术报告"。百度研究公开文档。
