Skip to content

世家 · 阿里达摩院(Alibaba DAMO Academy)

一家电商公司在 2017 年宣布要做"中国版贝尔实验室"的那一刻,中国科技企业第一次拥有了与基础研究对话的雄心;八年之后,通义千问把这份雄心兑现为全球最有影响力的中文开源大模型之一。

一、云栖大会上的 1000 亿

2017 年 10 月 11 日,杭州云溪小镇,云栖大会主论坛。

马云(Jack Ma)在演讲中宣布:阿里巴巴正式成立达摩院(DAMO Academy),未来三年投入超过 1000 亿元人民币,研究范围横跨人工智能、量子计算、机器学习、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术与嵌入式系统等十余个方向。

"达摩院"这个名字带有马云式的浪漫——表面上取自菩提达摩的禅宗故事,正式英文名 DAMO 又是 Discovery、Adventure、Momentum、Outlook 的首字母缩略。

马云为达摩院定下的硬性指标颇为大胆:"活得要比阿里巴巴长,至少 102 年;服务全世界至少 20 亿人。"他的原话是:达摩院应该"赚钱,但不能为赚钱而做研究"。

首任院长由阿里巴巴 CTO 张建锋(行癫)兼任。学术咨询委员会聘请了一批量级足够的国际学者:图灵奖得主珀尔、机器学习宗师乔丹、量子物理学家潘建伟、密码学家王小云、人工智能学者李飞飞(彼时仍在 Google 任职)、计算机系统专家张亚勤等。

这份名单本身就是一种宣示。

那是中国互联网公司第一次把"基础科研"作为对外叙事的中心。云栖大会的现场掌声背后,是更大的不解:一家电商公司,凭什么搞这种"看上去不挣钱"的事情?

而在阿里内部,达摩院从一开始就和阿里云深度绑定。它的算力、工程团队、数据来源,都来自阿里云的基础设施;这种绑定既让它不必从头建设算力底座,也注定了多年之后它会与云业务合流。

二、芯片、量子与平头哥

达摩院启动之初,外界以为它会是一个纯软件、AI 偏向的研究院。事实证明马云比所有人都更"疯"。

2018 年 4 月,阿里宣布全资收购杭州中天微系统(C-SKY,国内嵌入式 CPU IP 公司)。同年 9 月,阿里把中天微与达摩院芯片团队整合为平头哥半导体(T-Head Semiconductor,名字来自非洲蜜獾,有"啥都敢咬"的网梗)。

2019 年 7 月,平头哥发布玄铁 910(Xuantie 910),当时全球性能最高的 RISC-V 处理器之一,单核 SPECint2006 跑分超过 7.1。

两个月后的 2019 年 9 月 25 日云栖大会,阿里推出含光 800(Hanguang 800)AI 推理 NPU,单芯片峰值性能在 ResNet-50 上达 78,563 IPS,是当时全球性能最强的 AI 推理芯片之一,部署在阿里电商的拍立淘等图像搜索服务中。

量子方向同样走得激进。2017 年达摩院成立量子实验室,邀请密歇根大学施尧耘任主任;2018 年实现 11 量子比特的超导量子计算系统;2024 年初阿里宣布将量子实验室整体捐赠给浙江大学,标志着这条战线的策略性收缩——但前期投入依然在中国量子计算社区留下了重要遗产。

数据库方向,达摩院深度参与了 OceanBase 的研发——后者从蚂蚁金服内部项目成长为全球 TPC-C 跑分第一的国产关系数据库,并多次以阿里、达摩院、蚂蚁联合署名的方式在 VLDB / SIGMOD 发表论文。

自动驾驶方向,达摩院主导研发了菜鸟末端配送物流车"小蛮驴",2020 年起在大学校园部署,是国产 L4 级低速无人车规模化最快的项目之一。

三、M6 与万亿参数的中文起点

AI 是达摩院最终走向公众的方向。

2020 年,达摩院推出M6(MultiModality-to-MultiModality Multitask Mega-transformer)多模态大模型,由杨红霞、林俊旸(Junyang Lin)等人主导。

2021 年 3 月发布 1000 亿参数版,2021 年 5 月扩展到 10 万亿参数(采用 MoE 架构)——这是当时全球公开宣布参数最高的中文大模型。M6 的目标场景是电商内多模态生成:商品文案、海报、虚拟试穿。

它没有面向消费者发布,但为团队积累了千卡到万卡级的大模型训练经验,也是 Qwen 系列工程团队的重要前身。

并行的另一条线是通义系列。2022 年 9 月,达摩院发布"通义"统一模型底座,覆盖 NLP、CV、多模态。

2023 年 4 月 11 日的阿里云峰会,张勇(时任阿里 CEO)现场发布通义千问(Qwen,"千问"取意千问千答,英文 Qwen 是 Qianwen 的拼写)—— 阿里第一款公开的对话式大模型。

通义千问 1.0 发布时,外界的反应很冷淡——"又一个对标 ChatGPT 的国产模型"。同期发布的还有百度文心一言、商汤日日新、华为盘古等几十个国产大模型,舆论疲劳已经开始。

但通义千问真正改变全球大模型格局,是在它选择全面开源之后。

四、Qwen——中国版 Llama

2023 年 8 月 3 日,阿里在 ModelScope(达摩院主导的中国版 Hugging Face)和 Hugging Face 同步开源 Qwen-7B 与 Qwen-7B-Chat,权重协议商业可用。

这是中国第一家走 Llama 路线、把自家旗舰模型权重直接放出来的大厂。三个月后 Qwen-14B 跟进,2023 年底 Qwen-72B、Qwen-Audio 全部开源。

此后 Qwen 系列以惊人的密度迭代:

  • 2024 年 2 月 Qwen1.5 发布,支持 32K 上下文,覆盖 0.5B 到 72B 共 6 个尺寸。
  • 2024 年 6 月 Qwen2 发布,引入 GQA、长上下文(128K)、多语言能力大幅增强;Qwen2-72B 在多项榜单逼近 Llama 3.1 405B。
  • 2024 年 9 月 Qwen2.5 系列发布,专项分化出 Qwen2.5-Coder、Qwen2.5-Math。Qwen2.5-72B-Instruct 在 LMSYS Chatbot Arena 一度登顶开源模型第一。
  • 2025 年起 Qwen3 系列、Qwen3-Coder、Qwen-Max、Qwen-VL Max、Qwen-Omni 多模态、Qwen3-Next 等持续发布;Qwen 在 Hugging Face 上的累计下载量长期居中国模型第一,被海外社区称作"中国版 Llama"。

通义千问技术线由林俊旸(Junyang Lin)、白金泽、刘羿然等核心研究员主导,向上由阿里云 CTO 周靖人(Jingren Zhou,普林斯顿计算机博士、前微软合伙人副总裁)统筹。

周靖人是这一时期阿里 AI 战略的关键人物,也是 Qwen 开源决策的主要推动者之一。

开源带来的回报远超预期:到 2025 年,Hugging Face 排行榜上以 Qwen 为基座微调的衍生模型已经过万,Qwen 成为继 Llama 之后被全球开发者使用最多的开源大模型家族。

五、蔡崇信、吴泳铭与 All in AI

2023 年 9 月 10 日(阿里巴巴 24 周年),阿里宣布人事大调整:蔡崇信(Joseph Tsai)出任董事会主席,吴泳铭(Eddie Wu)出任 CEO。两人都是阿里巴巴 1999 年的"十八罗汉"之一。

吴泳铭在 11 月就职演讲中提出了被反复引用的两句话:阿里要"用户为先、AI 驱动",并把"All in AI"列为公司未来十年最重要的战略。

这次换帅之后,阿里巴巴对 AI 的资源倾斜进入第二个量级。2024 年 2 月,阿里宣布以战略投资的方式入股月之暗面(Kimi)、深度求索(DeepSeek)的早期轮次,几乎覆盖中国所有头部大模型创业公司。

2024 年起,阿里云在国内 MaaS(Model as a Service)市场份额排名第一,通义千问与第三方模型在百炼平台上同台托管。

2024 年 11 月,阿里与苹果就"中国版 Apple Intelligence"达成合作,通义千问被选为苹果 iPhone 在中国大陆国行版本的 AI 模型供应方之一——这是中国大模型第一次进入全球顶级硬件平台的内置 AI 栈,被业界视为对 Qwen 模型能力的一次最公开的背书。

2025 年 2 月,阿里 CEO 吴泳铭在迪拜接受彭博专访时宣布:未来三年阿里将投入超过 3800 亿元人民币用于云与 AI 基础设施,超过过去十年总和。

资本市场对这次表态做出剧烈反应,阿里港股年内一度上涨超过 70%,市值重回 3000 亿美元。

六、达摩院与阿里云——一体两面

随着大模型成为公司战略中心,达摩院的边界变得越来越模糊。

从 2023 年起,"达摩院"逐步淡出对外品牌,旗下大模型与云相关团队基本并入阿里云智能。今天的"通义"实验室,组织上属于阿里云;研究上承袭达摩院;商业上对接 MaaS 与 ToB。

芯片(平头哥)独立运营,2024 年起以平头哥半导体子公司的形式加大对外销售;量子已经剥离给浙江大学;数据库方向(OceanBase)与蚂蚁深度绑定;自动驾驶(小蛮驴)保留在达摩院旗下;其他基础学科方向部分归入达摩院量子实验室之外的研究中心、部分以基金资助方式与高校合作。

这种演化让外界不再把达摩院视为独立的"中国版贝尔实验室",而看作阿里云 AI 的研究上游。马云 2017 年定下的"赚钱但不为赚钱"的理想,在大模型时代不可避免地与商业化目标合流。

但也正因为如此,阿里成为中国大厂中商业化路径最清晰的一家:模型训练—模型托管—算力售卖,三条都在阿里云这一个出口。

七、八年之后

回望 2017–2025 这八年,达摩院给中国 AI 留下的最重要的三件事,依次是:

  • 把"基础研究"四个字写进了一家上市公司的财报;
  • 把含光、玄铁、平头哥这样一批硬科技项目带到了行业可见度内;
  • 把通义千问开源到了全球开发者的桌面上。

至于它有没有成为"中国版贝尔实验室",答案大概是:没有,但它让"中国版贝尔实验室"这个想法第一次变得不那么虚妄。

这是一种更实际的胜利——不是建成了什么神庙,而是给后来者验证了"投得起、做得出、用得上"这条路在中国互联网公司里走得通。

太史公曰

达摩院之兴,肇于 2017 年云栖之上,马云许之以千亿。一时学者云集,议者纷然,曰:电商之家,何以言基础?然八年之间,平头哥出,含光成,玄铁产;M6 启之于前,通义千问继之于后,开源七十二亿、七百二十亿之模型,遍布天下,海内外开发者得以为基。其志固不能尽如初言——量子裂、达摩之名渐隐于云之名下,研究渐与商业合流——然其遗者三:使"基础研究"四字得列于上市公司之议事;使"中国大模型"得以与 Llama 比肩于 Hugging Face;使"开源"二字成为中国大厂的策略而非姿态。马云之千亿,未必尽用其意,然达摩院已立。

亲历者说

征集中

如果你曾在阿里达摩院、平头哥或通义千问团队工作,欢迎提交贡献

参考资料

  1. 马云(2017 年 10 月 11 日)。"达摩院成立"主题演讲,云栖大会现场实录。
  2. Bai, J., Bai, S., Chu, Y., et al. (2023). "Qwen Technical Report." arXiv:2309.16609.
  3. Yang, A., Yang, B., Hui, B., et al. (2024). "Qwen2 Technical Report." arXiv:2407.10671.
  4. Qwen Team (2024). "Qwen2.5 Technical Report." arXiv:2412.15115.
  5. Lin, J., Yang, A., Zhang, Y., et al. (2021). "M6: A Chinese Multimodal Pretrainer." arXiv:2103.00823.
  6. T-Head Semiconductor (2019). "Hanguang 800: A High-Performance AI Inference Chip." Hot Chips 31 演讲资料。
  7. 阿里巴巴集团(2017–2024)。Annual Report (Form 20-F),达摩院投入与组织信息。
  8. 周靖人(2024)。"通义大模型与阿里云 MaaS 战略",阿里云栖大会主旨演讲。
  9. 吴泳铭(2023 年 11 月)。"用户为先,AI 驱动",阿里巴巴全员信。
  10. 财新(2024 年 4 月)。《阿里 All in AI 路线图》深度报道。
  11. Bloomberg(2025 年 2 月)。"Alibaba to Spend $53 Billion on AI Infrastructure."
  12. ModelScope 官方文档(2022–2025)。
  13. OceanBase Team (2019). "OceanBase: A 707 Million tpmC TPC-C Benchmark." TPC.org 公开报告。