世家 · 智谱 AI（GLM 系列）

从清华大学知识工程实验室走出的中国大模型公司，以学院派的严谨与开源路线，把"GLM"三个字母写进了中文 NLP 的核心词库。

一、清华 KEG 的二十年伏笔

要理解智谱 AI，必须先回到清华大学计算机系的一个房间——知识工程实验室（Knowledge Engineering Group，KEG）。这个实验室由李涓子、唐杰等人建立，长期主攻知识图谱、社会网络分析与图挖掘。2006 年起，KEG 启动名为 ArnetMiner / AMiner 的全球学者数据库项目，以学术论文为节点构建百万级知识图谱——在大模型尚未出现的年代，这是中国最早的"AI for Knowledge"基础设施之一。这套系统至今仍在线运行，覆盖全球数亿篇论文与数百万学者档案，是国内学术圈里使用最广泛的科研图谱平台之一。

KEG 的核心人物是清华大学计算机系教授唐杰（Tang Jie）。他在数据挖掘、社会网络与图神经网络方向连续多年位列全球高被引学者，2017 年起出任清华大学知识工程实验室副主任，长期带领博士生在 KDD、WWW、ACL 等顶会发表论文。2018 年 BERT 发布后，KEG 开始把目光从知识图谱转向预训练语言模型——一边用图谱标注数据，一边训练自己的模型。这种"图谱 + 语言模型"的混合路线，是后来 GLM 路径的源头之一。

2019 年 6 月，唐杰与他的博士生张鹏（Zhang Peng）等人共同创办了北京智谱华章科技有限公司（Zhipu AI），张鹏出任 CEO，唐杰作为首席科学家与董事长，把实验室二十年的积累一次性带进了公司。早期资金来自清华系基金、君联资本等机构，公司初创团队不足 30 人，办公地点就在清华园紧邻的中关村东路。

学院派血统是智谱最鲜明的标签。早期员工绝大多数来自清华、北大与中科院，许多人同时挂着教授、博士生与公司员工三重身份——白天在 FIT 楼上课、晚上在科技园写代码。这种"实验室即创业公司"的结构，决定了智谱在中文大模型阵营里始终带着一种学术气质——发论文、开源代码、写技术报告，与硅谷的 Anthropic、Meta FAIR 形成微妙呼应，与字节豆包、阿里通义那种"互联网产品公司式"的大模型团队气质截然不同。

公司核心团队中除唐杰、张鹏外，还有清华大学计算机系副教授东昱晓（图神经网络方向）、副教授刘知远（自然语言处理方向，长期参与 OpenBMB 与 ChatGLM 项目，是国内 NLP 学界最年轻的核心人物之一）等多位学界中坚。这种"教授集体下场"的格局，使智谱与其他大模型公司形成显著区分。

二、GLM 范式：一个统一的预训练框架

2021 年 3 月，唐杰团队在 arXiv 上发表论文 GLM: General Language Model Pretraining with Autoregressive Blank Infilling，首次提出 GLM（General Language Model）预训练范式。彼时主流路线分为两条：BERT 走双向自编码（理解任务强），GPT 走自回归（生成任务强）。GLM 试图把两者统一——通过"自回归空白填充"（Autoregressive Blank Infilling）任务，既能像 BERT 一样理解上下文，又能像 GPT 一样生成连贯文本。

这条路线最重要的工程产物是 2022 年 8 月发布的 GLM-130B——1300 亿参数的中英双语千亿级开源模型。它与 Meta 的 OPT-175B、BigScience 的 BLOOM-176B 几乎同时问世，是同期世界上仅有的几个开放权重的千亿参数大模型之一。GLM-130B 的训练论文里详细记录了在国产 A100 与昇腾 910 集群上的混合精度训练经验，包括如何处理 INT4 量化、梯度异常、loss spike——这些工程细节对后来中国大模型的训练实践影响深远。

GLM-130B 不是面向消费者的对话产品——它是一个研究里程碑：证明中国学术机构有能力独立训练千亿级模型，并以开放权重的方式让社区复用。论文与权重一同公开后，HuggingFace 上的下载量在 ChatGPT 出现前就已破万，被斯坦福大学 HELM 评测列入与 OPT、BLOOM 同级别的对比模型之一。这次"提前一步"的训练经验，为半年后 ChatGLM 的快速反应埋下了关键伏笔。

三、ChatGLM-6B：中文开源对话的破冰者

2022 年 11 月 ChatGPT 横空出世，全球 NLP 圈震动。彼时国内大厂仍在内部论证"大模型是否值得做"，智谱却已经有了 GLM-130B 的训练经验和清华学生构成的工程团队，反应极快。2023 年 3 月 14 日——离 ChatGPT 发布不到四个月——智谱开源 ChatGLM-6B：62 亿参数、基于 GLM 架构、中英双语对话微调、支持消费级显卡（INT4 量化下 6GB 显存即可运行）。

ChatGLM-6B 是中国开源社区第一个"能在自己电脑上跑起来"的对话大模型。HuggingFace 与 GitHub 上的下载量很快突破百万，国内大量个人开发者、中小企业、高校实验室围绕它构建私有化应用——客服、写作助手、知识问答、本地 RAG。开源仅两个月，GitHub 仓库 star 数破 2 万；六个月后破 4 万。它对中文开源生态的意义堪比同年 LLaMA 之于全球开源生态：一夜之间，中国有了自己的"开源大模型基线"。许多后来出现的中文垂直模型——医疗、法律、金融——最初都是基于 ChatGLM-6B 微调而来。

之后版本迭代密集：

ChatGLM2-6B（2023 年 6 月）：上下文从 2K 扩展到 32K，推理速度提升一倍。
ChatGLM3-6B（2023 年 10 月）：支持工具调用与代码解释器，对齐 OpenAI Function Calling。
GLM-4（2024 年 1 月 16 日）：闭源旗舰模型，对标 GPT-4，支持 128K 上下文与原生工具调用。
GLM-4-Plus（2024 年 8 月）：在 MMLU、CMMLU、GSM8K 等多项基准上接近或超越 GPT-4o。
GLM-4-Voice（2024 年 10 月）：端到端语音模型，支持中英语音对话与情感表达，与 OpenAI Advanced Voice 同期。
GLM-4.5 / GLM-4.6（2025 年）：开源旗舰，参数规模达千亿级，性能持续逼近第一梯队闭源模型。

到 2025 年，智谱的多模态分支也开枝散叶：CogVLM 系列视觉语言模型在 HuggingFace 上下载量过百万；CogVideoX（2024 年 8 月开源）是中国最早开放的高质量文生视频模型之一，被全球开发者广泛二次开发；图像生成 CogView 系列从 2021 年起持续迭代，是中文社区少数从一开始就坚持开源的多模态系列。

CogView 与 CogVLM 的存在让智谱在国际开源社区里享有不低于 LLaMA 系列的研究声誉——欧美高校实验室引用智谱模型做对比基线已经是标准做法。这种学术影响力是字节、阿里这类闭源大厂难以替代的资产。

需要指出的一点是：智谱旗下的开源模型许可证大多并非完全自由的 Apache 2.0 / MIT，而是带有"商用需登记"的限制条款——这与 Meta LLaMA 的策略类似，既保留对生态的影响力，又防止纯商业套壳。这一点曾在中国开发者社区引发争论，但更多被理解为"在中国语境下的合理选择"。

四、智谱清言与商业化版图

模型之外，智谱也做产品。2023 年 8 月，C 端对话应用 智谱清言 上线，是国内首批通过《生成式人工智能服务管理暂行办法》备案的大模型产品之一——与百度文心一言、阿里通义千问、商汤商量同列首批 11 家。智谱清言的市场存在感不及字节豆包与月之暗面 Kimi，但稳定占据国内 C 端大模型用户量的前列阵营，月活级别在百万到千万之间。其差异化在于"GLM-4 + 智能体"——较早把 Agent、代码解释器、文档问答整合进一个对话界面。

真正构成智谱营收基本盘的是 B 端 MaaS（Model as a Service）平台 BigModel.cn 与私有化部署。2024 年起，智谱拿下大量央企、国企、地方政府客户——金融、能源、电力、政务、教育——成为中国国家队大模型的代表供应商。它的客户名单里包括中国移动、国家电网、招商银行、中信集团等头部机构，这些大单提供了稳定的现金流，也强化了它的"国家队"标签。智谱据传在 2024 年的 ToB 收入是国内大模型创业公司中最高的几家之一。

ToB 的另一端是开发者生态。BigModel.cn 平台对开发者开放 GLM-4 系列 API，定价策略激进——GLM-4 Air 等版本在 2024 年下半年的价格战中数次降价，部分轻量模型 API 价格降至千 token 几分钱级别，与字节、阿里、DeepSeek 一道把中国大模型 API 价格拉到全球最低水平之一。这场"中文 LLM 价格战"被海外媒体多次报道，被视为中国大模型市场结构与硅谷不同的关键证据。

2024 年 9 月，智谱完成新一轮战略融资，金额约 30 亿元人民币，估值约 200 亿元人民币——成为中国"AI 大模型四小龙"（智谱、月之暗面、百川智能、零一万物）中估值最高的一家。投资方阵容堪称豪华：阿里巴巴、腾讯、美团、小米、蚂蚁集团、君联资本、社保基金、中关村发展集团。互联网巨头与国家资本同时入场，是这家公司"产学官"三重身份的直观体现。

值得注意的是，几乎所有头部互联网巨头都在智谱的股东表上同时出现——这种"全员入股"的格局在中国大模型公司里只此一家。一种解读是：智谱因清华背景与"政治可靠"被视为各家都不能错过的战略选项；另一种解读是，没有任何一家想错过下一个 OpenAI 的故事，宁可分散下注。

五、被列入实体清单的那一天

2025 年 1 月 15 日，美国财政部外国资产控制办公室（OFAC）发布公告，将智谱 AI 及其多家关联实体列入实体清单（Entity List），理由是"为中国军事现代化提供 AI 能力支持"。这是中国大模型公司第一次因模型业务被美国直接制裁，是 2024 年底美方加码出口管制的一个延伸动作。

制裁的实际影响包括：禁止美国公司向其供应高端 GPU、限制其使用美国云服务、限制其与美国机构的学术合作。智谱在公开声明中表示对相关指控"坚决反对"，并强调其模型完全用于民用与商用场景。但被列入实体清单本身已经改变了它在国际开源社区的处境——HuggingFace 与 GitHub 的访问、与海外学术机构的合作论文、与美元基金的潜在融资都受到不同程度影响。

实体清单事件的背景是 2024 年下半年的中美 AI 竞赛白热化——OpenAI 在 2024 年 6 月公开宣布将"逐步限制中国 IP 访问 ChatGPT API"，国内大模型公司被推到一个必须替代的位置。智谱因为开源旗舰、千亿参数、央企客户三重属性集于一身，成为最先被"对位制裁"的一家。从某种角度说，这次制裁也是一份"反向认证"：在美国监管者眼中，智谱已经被定义为中国 AI 工业体系中不可替代的一环。

某种意义上，这场制裁也确认了智谱在中国大模型版图中的地位——它不再是清华园里的一个实验室公司，而是被外部世界视为国家级战略资产的代表性企业。

实体清单事件之后，智谱在公开传播中明显加重了"自主可控"与"国产算力"的叙事：在昇腾、寒武纪等国产芯片上完成大模型训练与推理验证，参与多个由信通院、工信部牵头的"基础模型评测基准"。它不再只是一家创业公司，更被官方话语写入"科技自立"的样板段落。

六、与四小龙的并立与分化

2024–2025 年中国大模型竞赛进入下半场，"四小龙"格局逐渐分化。

智谱坚持"开源 + B 端 + 学术"三位一体。它不像月之暗面那样在 C 端投流，也不像 MiniMax 那样押注海外消费产品，而是把自己定位成"中国版 Anthropic + Meta FAIR"——既要做最强的开源基线，又要做最稳的企业级供应商。这种定位让它在 ToB 市场里几乎没有正面对手，却也错过了 C 端用户增长的窗口。在 2024 年下半年的 C 端流量战中，智谱清言基本没有参与，而是把资源持续投向 GLM-4-Plus、GLM-4-Voice、CogVideoX 等模型本身的迭代。

百川智能（王小川创立）走过类似路径但更偏行业垂直；零一万物（李开复创立）2024 年下半年起转向"模型即业务"，淡化通用大模型路线；月之暗面（杨植麟创立）专注 C 端长上下文。四家公司从 2023 年的"齐头并进"逐渐分化为各自找位的不同阶段。

四小龙之外还有更激烈的对手：字节豆包凭借抖音流量做到亿级月活，阿里通义凭借云与电商场景做出最完整的开源 Qwen 系列，DeepSeek则以极致开源 + 推理模型成为 2025 年最具国际声量的中国大模型品牌。智谱面对的是一个比 2023 年更拥挤的赛道。

到 2026 年初，行业普遍把智谱视为四小龙中"最接近 IPO"的一家——它在港股的上市进程被多家媒体报道，与 MiniMax 并称"中国大模型双雄"的传闻在投资圈广泛流传。如能成功登陆港股，智谱将是中国第一批真正意义上的"上市大模型公司"，对整个行业的估值参照系都将产生重要影响。

在地缘政治视角下，智谱也是中国大模型公司中第一家被海外学界正式当作"对位 OpenAI"研究对象的——剑桥、斯坦福、CSET 等机构 2024–2025 年发布的多份报告把智谱列为分析重点之一，篇幅与对 DeepSeek 的关注相当。

七、智谱清言之外：Agent 与 AutoGLM

2024–2025 年间，智谱在产品形态上做了一次重要的押注：AutoGLM。这是一个面向手机与浏览器场景的"通用 Agent"产品，能够通过语音指令完成订机票、刷外卖、整理文档等多步任务，与 Anthropic Claude 的 Computer Use、OpenAI Operator 同属一条赛道。AutoGLM 在 2024 年 10 月首次公开演示时引发热议——它不只是一个对话机器人，而是一个"操作机器人"，让大模型直接接管手机屏幕完成真实任务。

AutoGLM 之所以重要，是因为它代表智谱在产品形态上的一次跳跃——从"聊天框 + API"走向"屏幕操作 + Agent"。这条路线如果走通，将打开比聊天助手宽得多的应用场景；走不通，则可能耗费大量资源而不见显著回报。到 2025 年底，AutoGLM 仍在迭代，处于"有惊艳演示但未大规模铺开"的状态——这一阶段恰恰是 Agent 这条赛道全球的共同处境。

八、作为机构的智谱

回到智谱本身：它的特殊性来自三个叠加。

它是一个学院派公司——CEO 与首席科学家同时是清华教授，员工里有大量博士与高校教师，发表论文的密度远超国内同行。在 ACL、NeurIPS、ICLR 等顶会上，"THUDM"（Tsinghua University Data Mining Group）作为合作单位出现的频率极高，是国内大模型公司中学术发表最活跃的一家。

它是一个"开源派"公司——从 ChatGLM 到 CogVLM 到 CogVideoX，几乎每一代旗舰都有开源版本。它的开源策略与 Meta LLaMA 类似但更激进：连训练代码与推理框架都一并开源，使全球高校能复现实验，也让 ChatGLM 成为中文 NLP 教学里的标准实验对象。

它也是一个"国家队"公司——客户名单里央企林立，资本结构里社保基金与国资在场，被美国列入实体清单后更被官方话语视为"必须支持的战略科技力量"。在中国大模型创业公司中，没有哪家比智谱更接近"国家信息基础设施"的定位。

这三重身份既是优势也是负担。学院派让它技术扎实但对市场反应略慢；开源让它社区影响力巨大但商业利润比闭源对手薄；国家队让它资金充裕但意味着在地缘政治变局里首当其冲。三种身份相互拉扯，使智谱的每一个战略选择都比纯商业公司复杂——它不能像字节豆包那样纯粹追求用户量，也不能像 DeepSeek 那样纯粹追求开源声誉。

智谱的故事是中国 AI 路径的一个缩影：从大学实验室出发，借开源建立社区，靠 ToB 拿到现金流，最终站在国家与国际的两道目光之下。它不一定能成为下一个 OpenAI，但它已经是中国"自主大模型"叙事中无法绕开的一个坐标。

到 2026 年初，无论这家公司最终走向 IPO 还是被某种形式的整合，它在 2019–2025 这六年间留下的痕迹已经清晰：把 GLM 框架写进 NLP 教科书，把 ChatGLM 写进每一个想本地跑大模型的开发者的硬盘，把"中文千亿开源大模型"这件事从无到有做成现实。这就是智谱在中国 AI 史上最值得记下的一笔。

太史公曰

智谱之兴，起于清华一隅之 KEG 实验室。唐张师徒，深耕图谱二十年，及大模型时至，乃以 GLM 一框架统理解生成于一炉，复以 ChatGPT 之风刚起，旬月之间开源 ChatGLM-6B，使天下学子有可下载之中文模型。是其速也，非一日之功。然其立身之本不在 C 端流量，而在学术、开源、央企三事鼎足而立——故一旦风波至，外有 OFAC 之制裁，内有四小龙之分化，皆不能动摇其底盘。智谱之于中国大模型，犹清华之于中国理工——非以最锋利取胜，而以最深厚立身。其能否成下一 OpenAI 未可知，然中国"自主大模型"叙事舍智谱必不能成篇。

关于智谱的最后一笔可以放在 2025 年的一份海外报告上：CSIS（战略与国际研究中心）评估中国 AI 公司"系统性风险"时，把智谱列在与 DeepSeek、阿里通义同一级。十年前，类似清单上几乎只有 BAT 三家。这种位置变化本身，就是中国 AI 这十年最简单也最锋利的注脚。

亲历者说

征集中

如果你曾在智谱 AI 或清华 KEG 实验室工作学习，欢迎提交贡献。

参考资料

Du, Z., Qian, Y., Liu, X., Ding, M., Qiu, J., Yang, Z., & Tang, J. (2022). "GLM: General Language Model Pretraining with Autoregressive Blank Infilling." ACL 2022.
Zeng, A., Liu, X., Du, Z., et al. (2023). "GLM-130B: An Open Bilingual Pre-trained Model." ICLR 2023.
THUDM (2023). "ChatGLM-6B: An Open Bilingual Dialogue Language Model." GitHub: github.com/THUDM/ChatGLM-6B.
Tang, J., et al. (2008). "ArnetMiner: Extraction and Mining of Academic Social Networks." KDD 2008.
智谱 AI (2024). "GLM-4 技术报告." bigmodel.cn.
U.S. Department of the Treasury, OFAC (2025-01-15). "Treasury Sanctions Entities Supporting China's Military-Industrial Base."
财新周刊 (2024). "智谱 AI：清华系大模型独角兽的 ToB 路径."
36 氪 (2024-09). "智谱 AI 完成新一轮 30 亿元融资，估值达 200 亿."
Wang, W., et al. (2023). "CogVLM: Visual Expert for Pretrained Language Models." arXiv:2311.03079.
Yang, Z., et al. (2024). "CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer." arXiv:2408.06072.
MIT Technology Review (2024). "China's Open-Source AI Strategy: The Rise of Zhipu and DeepSeek."
南方周末 (2025). "被列入实体清单之后：智谱 AI 的下一步."

世家 · 智谱 AI（GLM 系列） ​

一、清华 KEG 的二十年伏笔 ​

二、GLM 范式：一个统一的预训练框架 ​

三、ChatGLM-6B：中文开源对话的破冰者 ​

四、智谱清言与商业化版图 ​

五、被列入实体清单的那一天 ​

六、与四小龙的并立与分化 ​

七、智谱清言之外：Agent 与 AutoGLM ​

八、作为机构的智谱 ​

亲历者说 ​

参考资料 ​