世家 · 阿里达摩院（Alibaba DAMO Academy）

一家电商公司在 2017 年宣布要做"中国版贝尔实验室"的那一刻，中国科技企业第一次拥有了与基础研究对话的雄心；八年之后，通义千问把这份雄心兑现为全球最有影响力的中文开源大模型之一。

一、云栖大会上的 1000 亿

2017 年 10 月 11 日，杭州云溪小镇，云栖大会主论坛。

马云（Jack Ma）在演讲中宣布：阿里巴巴正式成立达摩院（DAMO Academy），未来三年投入超过 1000 亿元人民币，研究范围横跨人工智能、量子计算、机器学习、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术与嵌入式系统等十余个方向。

"达摩院"这个名字带有马云式的浪漫——表面上取自菩提达摩的禅宗故事，正式英文名 DAMO 又是 Discovery、Adventure、Momentum、Outlook 的首字母缩略。

马云为达摩院定下的硬性指标颇为大胆："活得要比阿里巴巴长，至少 102 年；服务全世界至少 20 亿人。"他的原话是：达摩院应该"赚钱，但不能为赚钱而做研究"。

首任院长由阿里巴巴 CTO 张建锋（行癫）兼任。学术咨询委员会聘请了一批量级足够的国际学者：图灵奖得主珀尔、机器学习宗师乔丹、量子物理学家潘建伟、密码学家王小云、人工智能学者李飞飞（彼时仍在 Google 任职）、计算机系统专家张亚勤等。

这份名单本身就是一种宣示。

那是中国互联网公司第一次把"基础科研"作为对外叙事的中心。云栖大会的现场掌声背后，是更大的不解：一家电商公司，凭什么搞这种"看上去不挣钱"的事情？

而在阿里内部，达摩院从一开始就和阿里云深度绑定。它的算力、工程团队、数据来源，都来自阿里云的基础设施；这种绑定既让它不必从头建设算力底座，也注定了多年之后它会与云业务合流。

二、芯片、量子与平头哥

达摩院启动之初，外界以为它会是一个纯软件、AI 偏向的研究院。事实证明马云比所有人都更"疯"。

2018 年 4 月，阿里宣布全资收购杭州中天微系统（C-SKY，国内嵌入式 CPU IP 公司）。同年 9 月，阿里把中天微与达摩院芯片团队整合为平头哥半导体（T-Head Semiconductor，名字来自非洲蜜獾，有"啥都敢咬"的网梗）。

2019 年 7 月，平头哥发布玄铁 910（Xuantie 910），当时全球性能最高的 RISC-V 处理器之一，单核 SPECint2006 跑分超过 7.1。

两个月后的 2019 年 9 月 25 日云栖大会，阿里推出含光 800（Hanguang 800）AI 推理 NPU，单芯片峰值性能在 ResNet-50 上达 78,563 IPS，是当时全球性能最强的 AI 推理芯片之一，部署在阿里电商的拍立淘等图像搜索服务中。

量子方向同样走得激进。2017 年达摩院成立量子实验室，邀请密歇根大学施尧耘任主任；2018 年实现 11 量子比特的超导量子计算系统；2024 年初阿里宣布将量子实验室整体捐赠给浙江大学，标志着这条战线的策略性收缩——但前期投入依然在中国量子计算社区留下了重要遗产。

数据库方向，达摩院深度参与了 OceanBase 的研发——后者从蚂蚁金服内部项目成长为全球 TPC-C 跑分第一的国产关系数据库，并多次以阿里、达摩院、蚂蚁联合署名的方式在 VLDB / SIGMOD 发表论文。

自动驾驶方向，达摩院主导研发了菜鸟末端配送物流车"小蛮驴"，2020 年起在大学校园部署，是国产 L4 级低速无人车规模化最快的项目之一。

三、M6 与万亿参数的中文起点

AI 是达摩院最终走向公众的方向。

2020 年，达摩院推出M6（MultiModality-to-MultiModality Multitask Mega-transformer）多模态大模型，由杨红霞、林俊旸（Junyang Lin）等人主导。

2021 年 3 月发布 1000 亿参数版，2021 年 5 月扩展到 10 万亿参数（采用 MoE 架构）——这是当时全球公开宣布参数最高的中文大模型。M6 的目标场景是电商内多模态生成：商品文案、海报、虚拟试穿。

它没有面向消费者发布，但为团队积累了千卡到万卡级的大模型训练经验，也是 Qwen 系列工程团队的重要前身。

并行的另一条线是通义系列。2022 年 9 月，达摩院发布"通义"统一模型底座，覆盖 NLP、CV、多模态。

2023 年 4 月 11 日的阿里云峰会，张勇（时任阿里 CEO）现场发布通义千问（Qwen，"千问"取意千问千答，英文 Qwen 是 Qianwen 的拼写）—— 阿里第一款公开的对话式大模型。

通义千问 1.0 发布时，外界的反应很冷淡——"又一个对标 ChatGPT 的国产模型"。同期发布的还有百度文心一言、商汤日日新、华为盘古等几十个国产大模型，舆论疲劳已经开始。

但通义千问真正改变全球大模型格局，是在它选择全面开源之后。

四、Qwen——中国版 Llama

2023 年 8 月 3 日，阿里在 ModelScope（达摩院主导的中国版 Hugging Face）和 Hugging Face 同步开源 Qwen-7B 与 Qwen-7B-Chat，权重协议商业可用。

这是中国第一家走 Llama 路线、把自家旗舰模型权重直接放出来的大厂。三个月后 Qwen-14B 跟进，2023 年底 Qwen-72B、Qwen-Audio 全部开源。

此后 Qwen 系列以惊人的密度迭代：

2024 年 2 月 Qwen1.5 发布，支持 32K 上下文，覆盖 0.5B 到 72B 共 6 个尺寸。
2024 年 6 月 Qwen2 发布，引入 GQA、长上下文（128K）、多语言能力大幅增强；Qwen2-72B 在多项榜单逼近 Llama 3.1 405B。
2024 年 9 月 Qwen2.5 系列发布，专项分化出 Qwen2.5-Coder、Qwen2.5-Math。Qwen2.5-72B-Instruct 在 LMSYS Chatbot Arena 一度登顶开源模型第一。
2025 年起 Qwen3 系列、Qwen3-Coder、Qwen-Max、Qwen-VL Max、Qwen-Omni 多模态、Qwen3-Next 等持续发布；Qwen 在 Hugging Face 上的累计下载量长期居中国模型第一，被海外社区称作"中国版 Llama"。

通义千问技术线由林俊旸（Junyang Lin）、白金泽、刘羿然等核心研究员主导，向上由阿里云 CTO 周靖人（Jingren Zhou，普林斯顿计算机博士、前微软合伙人副总裁）统筹。

周靖人是这一时期阿里 AI 战略的关键人物，也是 Qwen 开源决策的主要推动者之一。

开源带来的回报远超预期：到 2025 年，Hugging Face 排行榜上以 Qwen 为基座微调的衍生模型已经过万，Qwen 成为继 Llama 之后被全球开发者使用最多的开源大模型家族。

五、蔡崇信、吴泳铭与 All in AI

2023 年 9 月 10 日（阿里巴巴 24 周年），阿里宣布人事大调整：蔡崇信（Joseph Tsai）出任董事会主席，吴泳铭（Eddie Wu）出任 CEO。两人都是阿里巴巴 1999 年的"十八罗汉"之一。

吴泳铭在 11 月就职演讲中提出了被反复引用的两句话：阿里要"用户为先、AI 驱动"，并把"All in AI"列为公司未来十年最重要的战略。

这次换帅之后，阿里巴巴对 AI 的资源倾斜进入第二个量级。2024 年 2 月，阿里宣布以战略投资的方式入股月之暗面（Kimi）、深度求索（DeepSeek）的早期轮次，几乎覆盖中国所有头部大模型创业公司。

2024 年起，阿里云在国内 MaaS（Model as a Service）市场份额排名第一，通义千问与第三方模型在百炼平台上同台托管。

2024 年 11 月，阿里与苹果就"中国版 Apple Intelligence"达成合作，通义千问被选为苹果 iPhone 在中国大陆国行版本的 AI 模型供应方之一——这是中国大模型第一次进入全球顶级硬件平台的内置 AI 栈，被业界视为对 Qwen 模型能力的一次最公开的背书。

2025 年 2 月，阿里 CEO 吴泳铭在迪拜接受彭博专访时宣布：未来三年阿里将投入超过 3800 亿元人民币用于云与 AI 基础设施，超过过去十年总和。

资本市场对这次表态做出剧烈反应，阿里港股年内一度上涨超过 70%，市值重回 3000 亿美元。

六、达摩院与阿里云——一体两面

随着大模型成为公司战略中心，达摩院的边界变得越来越模糊。

从 2023 年起，"达摩院"逐步淡出对外品牌，旗下大模型与云相关团队基本并入阿里云智能。今天的"通义"实验室，组织上属于阿里云；研究上承袭达摩院；商业上对接 MaaS 与 ToB。

芯片（平头哥）独立运营，2024 年起以平头哥半导体子公司的形式加大对外销售；量子已经剥离给浙江大学；数据库方向（OceanBase）与蚂蚁深度绑定；自动驾驶（小蛮驴）保留在达摩院旗下；其他基础学科方向部分归入达摩院量子实验室之外的研究中心、部分以基金资助方式与高校合作。

这种演化让外界不再把达摩院视为独立的"中国版贝尔实验室"，而看作阿里云 AI 的研究上游。马云 2017 年定下的"赚钱但不为赚钱"的理想，在大模型时代不可避免地与商业化目标合流。

但也正因为如此，阿里成为中国大厂中商业化路径最清晰的一家：模型训练—模型托管—算力售卖，三条都在阿里云这一个出口。

七、八年之后

回望 2017–2025 这八年，达摩院给中国 AI 留下的最重要的三件事，依次是：

把"基础研究"四个字写进了一家上市公司的财报；
把含光、玄铁、平头哥这样一批硬科技项目带到了行业可见度内；
把通义千问开源到了全球开发者的桌面上。

至于它有没有成为"中国版贝尔实验室"，答案大概是：没有，但它让"中国版贝尔实验室"这个想法第一次变得不那么虚妄。

这是一种更实际的胜利——不是建成了什么神庙，而是给后来者验证了"投得起、做得出、用得上"这条路在中国互联网公司里走得通。

太史公曰

达摩院之兴，肇于 2017 年云栖之上，马云许之以千亿。一时学者云集，议者纷然，曰：电商之家，何以言基础？然八年之间，平头哥出，含光成，玄铁产；M6 启之于前，通义千问继之于后，开源七十二亿、七百二十亿之模型，遍布天下，海内外开发者得以为基。其志固不能尽如初言——量子裂、达摩之名渐隐于云之名下，研究渐与商业合流——然其遗者三：使"基础研究"四字得列于上市公司之议事；使"中国大模型"得以与 Llama 比肩于 Hugging Face；使"开源"二字成为中国大厂的策略而非姿态。马云之千亿，未必尽用其意，然达摩院已立。

亲历者说

征集中

如果你曾在阿里达摩院、平头哥或通义千问团队工作，欢迎提交贡献。

参考资料

马云（2017 年 10 月 11 日）。"达摩院成立"主题演讲，云栖大会现场实录。
Bai, J., Bai, S., Chu, Y., et al. (2023). "Qwen Technical Report." arXiv:2309.16609.
Yang, A., Yang, B., Hui, B., et al. (2024). "Qwen2 Technical Report." arXiv:2407.10671.
Qwen Team (2024). "Qwen2.5 Technical Report." arXiv:2412.15115.
Lin, J., Yang, A., Zhang, Y., et al. (2021). "M6: A Chinese Multimodal Pretrainer." arXiv:2103.00823.
T-Head Semiconductor (2019). "Hanguang 800: A High-Performance AI Inference Chip." Hot Chips 31 演讲资料。
阿里巴巴集团（2017–2024）。Annual Report (Form 20-F)，达摩院投入与组织信息。
周靖人（2024）。"通义大模型与阿里云 MaaS 战略"，阿里云栖大会主旨演讲。
吴泳铭（2023 年 11 月）。"用户为先，AI 驱动"，阿里巴巴全员信。
财新（2024 年 4 月）。《阿里 All in AI 路线图》深度报道。
Bloomberg（2025 年 2 月）。"Alibaba to Spend $53 Billion on AI Infrastructure."
ModelScope 官方文档（2022–2025）。
OceanBase Team (2019). "OceanBase: A 707 Million tpmC TPC-C Benchmark." TPC.org 公开报告。

世家 · 阿里达摩院（Alibaba DAMO Academy） ​

一、云栖大会上的 1000 亿 ​

二、芯片、量子与平头哥 ​

三、M6 与万亿参数的中文起点 ​

四、Qwen——中国版 Llama ​

五、蔡崇信、吴泳铭与 All in AI ​

六、达摩院与阿里云——一体两面 ​

七、八年之后 ​

亲历者说 ​

参考资料 ​