世家 · 智谱 AI(GLM 系列)
从清华大学知识工程实验室走出的中国大模型公司,以学院派的严谨与开源路线,把"GLM"三个字母写进了中文 NLP 的核心词库。
一、清华 KEG 的二十年伏笔
要理解智谱 AI,必须先回到清华大学计算机系的一个房间——知识工程实验室(Knowledge Engineering Group,KEG)。这个实验室由李涓子、唐杰等人建立,长期主攻知识图谱、社会网络分析与图挖掘。2006 年起,KEG 启动名为 ArnetMiner / AMiner 的全球学者数据库项目,以学术论文为节点构建百万级知识图谱——在大模型尚未出现的年代,这是中国最早的"AI for Knowledge"基础设施之一。这套系统至今仍在线运行,覆盖全球数亿篇论文与数百万学者档案,是国内学术圈里使用最广泛的科研图谱平台之一。
KEG 的核心人物是清华大学计算机系教授唐杰(Tang Jie)。他在数据挖掘、社会网络与图神经网络方向连续多年位列全球高被引学者,2017 年起出任清华大学知识工程实验室副主任,长期带领博士生在 KDD、WWW、ACL 等顶会发表论文。2018 年 BERT 发布后,KEG 开始把目光从知识图谱转向预训练语言模型——一边用图谱标注数据,一边训练自己的模型。这种"图谱 + 语言模型"的混合路线,是后来 GLM 路径的源头之一。
2019 年 6 月,唐杰与他的博士生张鹏(Zhang Peng)等人共同创办了北京智谱华章科技有限公司(Zhipu AI),张鹏出任 CEO,唐杰作为首席科学家与董事长,把实验室二十年的积累一次性带进了公司。早期资金来自清华系基金、君联资本等机构,公司初创团队不足 30 人,办公地点就在清华园紧邻的中关村东路。
学院派血统是智谱最鲜明的标签。早期员工绝大多数来自清华、北大与中科院,许多人同时挂着教授、博士生与公司员工三重身份——白天在 FIT 楼上课、晚上在科技园写代码。这种"实验室即创业公司"的结构,决定了智谱在中文大模型阵营里始终带着一种学术气质——发论文、开源代码、写技术报告,与硅谷的 Anthropic、Meta FAIR 形成微妙呼应,与字节豆包、阿里通义那种"互联网产品公司式"的大模型团队气质截然不同。
公司核心团队中除唐杰、张鹏外,还有清华大学计算机系副教授东昱晓(图神经网络方向)、副教授刘知远(自然语言处理方向,长期参与 OpenBMB 与 ChatGLM 项目,是国内 NLP 学界最年轻的核心人物之一)等多位学界中坚。这种"教授集体下场"的格局,使智谱与其他大模型公司形成显著区分。
二、GLM 范式:一个统一的预训练框架
2021 年 3 月,唐杰团队在 arXiv 上发表论文 GLM: General Language Model Pretraining with Autoregressive Blank Infilling,首次提出 GLM(General Language Model)预训练范式。彼时主流路线分为两条:BERT 走双向自编码(理解任务强),GPT 走自回归(生成任务强)。GLM 试图把两者统一——通过"自回归空白填充"(Autoregressive Blank Infilling)任务,既能像 BERT 一样理解上下文,又能像 GPT 一样生成连贯文本。
这条路线最重要的工程产物是 2022 年 8 月发布的 GLM-130B——1300 亿参数的中英双语千亿级开源模型。它与 Meta 的 OPT-175B、BigScience 的 BLOOM-176B 几乎同时问世,是同期世界上仅有的几个开放权重的千亿参数大模型之一。GLM-130B 的训练论文里详细记录了在国产 A100 与昇腾 910 集群上的混合精度训练经验,包括如何处理 INT4 量化、梯度异常、loss spike——这些工程细节对后来中国大模型的训练实践影响深远。
GLM-130B 不是面向消费者的对话产品——它是一个研究里程碑:证明中国学术机构有能力独立训练千亿级模型,并以开放权重的方式让社区复用。论文与权重一同公开后,HuggingFace 上的下载量在 ChatGPT 出现前就已破万,被斯坦福大学 HELM 评测列入与 OPT、BLOOM 同级别的对比模型之一。这次"提前一步"的训练经验,为半年后 ChatGLM 的快速反应埋下了关键伏笔。
三、ChatGLM-6B:中文开源对话的破冰者
2022 年 11 月 ChatGPT 横空出世,全球 NLP 圈震动。彼时国内大厂仍在内部论证"大模型是否值得做",智谱却已经有了 GLM-130B 的训练经验和清华学生构成的工程团队,反应极快。2023 年 3 月 14 日——离 ChatGPT 发布不到四个月——智谱开源 ChatGLM-6B:62 亿参数、基于 GLM 架构、中英双语对话微调、支持消费级显卡(INT4 量化下 6GB 显存即可运行)。
ChatGLM-6B 是中国开源社区第一个"能在自己电脑上跑起来"的对话大模型。HuggingFace 与 GitHub 上的下载量很快突破百万,国内大量个人开发者、中小企业、高校实验室围绕它构建私有化应用——客服、写作助手、知识问答、本地 RAG。开源仅两个月,GitHub 仓库 star 数破 2 万;六个月后破 4 万。它对中文开源生态的意义堪比同年 LLaMA 之于全球开源生态:一夜之间,中国有了自己的"开源大模型基线"。许多后来出现的中文垂直模型——医疗、法律、金融——最初都是基于 ChatGLM-6B 微调而来。
之后版本迭代密集:
- ChatGLM2-6B(2023 年 6 月):上下文从 2K 扩展到 32K,推理速度提升一倍。
- ChatGLM3-6B(2023 年 10 月):支持工具调用与代码解释器,对齐 OpenAI Function Calling。
- GLM-4(2024 年 1 月 16 日):闭源旗舰模型,对标 GPT-4,支持 128K 上下文与原生工具调用。
- GLM-4-Plus(2024 年 8 月):在 MMLU、CMMLU、GSM8K 等多项基准上接近或超越 GPT-4o。
- GLM-4-Voice(2024 年 10 月):端到端语音模型,支持中英语音对话与情感表达,与 OpenAI Advanced Voice 同期。
- GLM-4.5 / GLM-4.6(2025 年):开源旗舰,参数规模达千亿级,性能持续逼近第一梯队闭源模型。
到 2025 年,智谱的多模态分支也开枝散叶:CogVLM 系列视觉语言模型在 HuggingFace 上下载量过百万;CogVideoX(2024 年 8 月开源)是中国最早开放的高质量文生视频模型之一,被全球开发者广泛二次开发;图像生成 CogView 系列从 2021 年起持续迭代,是中文社区少数从一开始就坚持开源的多模态系列。
CogView 与 CogVLM 的存在让智谱在国际开源社区里享有不低于 LLaMA 系列的研究声誉——欧美高校实验室引用智谱模型做对比基线已经是标准做法。这种学术影响力是字节、阿里这类闭源大厂难以替代的资产。
需要指出的一点是:智谱旗下的开源模型许可证大多并非完全自由的 Apache 2.0 / MIT,而是带有"商用需登记"的限制条款——这与 Meta LLaMA 的策略类似,既保留对生态的影响力,又防止纯商业套壳。这一点曾在中国开发者社区引发争论,但更多被理解为"在中国语境下的合理选择"。
四、智谱清言与商业化版图
模型之外,智谱也做产品。2023 年 8 月,C 端对话应用 智谱清言 上线,是国内首批通过《生成式人工智能服务管理暂行办法》备案的大模型产品之一——与百度文心一言、阿里通义千问、商汤商量同列首批 11 家。智谱清言的市场存在感不及字节豆包与月之暗面 Kimi,但稳定占据国内 C 端大模型用户量的前列阵营,月活级别在百万到千万之间。其差异化在于"GLM-4 + 智能体"——较早把 Agent、代码解释器、文档问答整合进一个对话界面。
真正构成智谱营收基本盘的是 B 端 MaaS(Model as a Service)平台 BigModel.cn 与私有化部署。2024 年起,智谱拿下大量央企、国企、地方政府客户——金融、能源、电力、政务、教育——成为中国国家队大模型的代表供应商。它的客户名单里包括中国移动、国家电网、招商银行、中信集团等头部机构,这些大单提供了稳定的现金流,也强化了它的"国家队"标签。智谱据传在 2024 年的 ToB 收入是国内大模型创业公司中最高的几家之一。
ToB 的另一端是开发者生态。BigModel.cn 平台对开发者开放 GLM-4 系列 API,定价策略激进——GLM-4 Air 等版本在 2024 年下半年的价格战中数次降价,部分轻量模型 API 价格降至千 token 几分钱级别,与字节、阿里、DeepSeek 一道把中国大模型 API 价格拉到全球最低水平之一。这场"中文 LLM 价格战"被海外媒体多次报道,被视为中国大模型市场结构与硅谷不同的关键证据。
2024 年 9 月,智谱完成新一轮战略融资,金额约 30 亿元人民币,估值约 200 亿元人民币——成为中国"AI 大模型四小龙"(智谱、月之暗面、百川智能、零一万物)中估值最高的一家。投资方阵容堪称豪华:阿里巴巴、腾讯、美团、小米、蚂蚁集团、君联资本、社保基金、中关村发展集团。互联网巨头与国家资本同时入场,是这家公司"产学官"三重身份的直观体现。
值得注意的是,几乎所有头部互联网巨头都在智谱的股东表上同时出现——这种"全员入股"的格局在中国大模型公司里只此一家。一种解读是:智谱因清华背景与"政治可靠"被视为各家都不能错过的战略选项;另一种解读是,没有任何一家想错过下一个 OpenAI 的故事,宁可分散下注。
五、被列入实体清单的那一天
2025 年 1 月 15 日,美国财政部外国资产控制办公室(OFAC)发布公告,将智谱 AI 及其多家关联实体列入实体清单(Entity List),理由是"为中国军事现代化提供 AI 能力支持"。这是中国大模型公司第一次因模型业务被美国直接制裁,是 2024 年底美方加码出口管制的一个延伸动作。
制裁的实际影响包括:禁止美国公司向其供应高端 GPU、限制其使用美国云服务、限制其与美国机构的学术合作。智谱在公开声明中表示对相关指控"坚决反对",并强调其模型完全用于民用与商用场景。但被列入实体清单本身已经改变了它在国际开源社区的处境——HuggingFace 与 GitHub 的访问、与海外学术机构的合作论文、与美元基金的潜在融资都受到不同程度影响。
实体清单事件的背景是 2024 年下半年的中美 AI 竞赛白热化——OpenAI 在 2024 年 6 月公开宣布将"逐步限制中国 IP 访问 ChatGPT API",国内大模型公司被推到一个必须替代的位置。智谱因为开源旗舰、千亿参数、央企客户三重属性集于一身,成为最先被"对位制裁"的一家。从某种角度说,这次制裁也是一份"反向认证":在美国监管者眼中,智谱已经被定义为中国 AI 工业体系中不可替代的一环。
某种意义上,这场制裁也确认了智谱在中国大模型版图中的地位——它不再是清华园里的一个实验室公司,而是被外部世界视为国家级战略资产的代表性企业。
实体清单事件之后,智谱在公开传播中明显加重了"自主可控"与"国产算力"的叙事:在昇腾、寒武纪等国产芯片上完成大模型训练与推理验证,参与多个由信通院、工信部牵头的"基础模型评测基准"。它不再只是一家创业公司,更被官方话语写入"科技自立"的样板段落。
六、与四小龙的并立与分化
2024–2025 年中国大模型竞赛进入下半场,"四小龙"格局逐渐分化。
智谱坚持"开源 + B 端 + 学术"三位一体。它不像月之暗面那样在 C 端投流,也不像 MiniMax 那样押注海外消费产品,而是把自己定位成"中国版 Anthropic + Meta FAIR"——既要做最强的开源基线,又要做最稳的企业级供应商。这种定位让它在 ToB 市场里几乎没有正面对手,却也错过了 C 端用户增长的窗口。在 2024 年下半年的 C 端流量战中,智谱清言基本没有参与,而是把资源持续投向 GLM-4-Plus、GLM-4-Voice、CogVideoX 等模型本身的迭代。
百川智能(王小川创立)走过类似路径但更偏行业垂直;零一万物(李开复创立)2024 年下半年起转向"模型即业务",淡化通用大模型路线;月之暗面(杨植麟创立)专注 C 端长上下文。四家公司从 2023 年的"齐头并进"逐渐分化为各自找位的不同阶段。
四小龙之外还有更激烈的对手:字节豆包凭借抖音流量做到亿级月活,阿里通义凭借云与电商场景做出最完整的开源 Qwen 系列,DeepSeek则以极致开源 + 推理模型成为 2025 年最具国际声量的中国大模型品牌。智谱面对的是一个比 2023 年更拥挤的赛道。
到 2026 年初,行业普遍把智谱视为四小龙中"最接近 IPO"的一家——它在港股的上市进程被多家媒体报道,与 MiniMax 并称"中国大模型双雄"的传闻在投资圈广泛流传。如能成功登陆港股,智谱将是中国第一批真正意义上的"上市大模型公司",对整个行业的估值参照系都将产生重要影响。
在地缘政治视角下,智谱也是中国大模型公司中第一家被海外学界正式当作"对位 OpenAI"研究对象的——剑桥、斯坦福、CSET 等机构 2024–2025 年发布的多份报告把智谱列为分析重点之一,篇幅与对 DeepSeek 的关注相当。
七、智谱清言之外:Agent 与 AutoGLM
2024–2025 年间,智谱在产品形态上做了一次重要的押注:AutoGLM。这是一个面向手机与浏览器场景的"通用 Agent"产品,能够通过语音指令完成订机票、刷外卖、整理文档等多步任务,与 Anthropic Claude 的 Computer Use、OpenAI Operator 同属一条赛道。AutoGLM 在 2024 年 10 月首次公开演示时引发热议——它不只是一个对话机器人,而是一个"操作机器人",让大模型直接接管手机屏幕完成真实任务。
AutoGLM 之所以重要,是因为它代表智谱在产品形态上的一次跳跃——从"聊天框 + API"走向"屏幕操作 + Agent"。这条路线如果走通,将打开比聊天助手宽得多的应用场景;走不通,则可能耗费大量资源而不见显著回报。到 2025 年底,AutoGLM 仍在迭代,处于"有惊艳演示但未大规模铺开"的状态——这一阶段恰恰是 Agent 这条赛道全球的共同处境。
八、作为机构的智谱
回到智谱本身:它的特殊性来自三个叠加。
它是一个学院派公司——CEO 与首席科学家同时是清华教授,员工里有大量博士与高校教师,发表论文的密度远超国内同行。在 ACL、NeurIPS、ICLR 等顶会上,"THUDM"(Tsinghua University Data Mining Group)作为合作单位出现的频率极高,是国内大模型公司中学术发表最活跃的一家。
它是一个"开源派"公司——从 ChatGLM 到 CogVLM 到 CogVideoX,几乎每一代旗舰都有开源版本。它的开源策略与 Meta LLaMA 类似但更激进:连训练代码与推理框架都一并开源,使全球高校能复现实验,也让 ChatGLM 成为中文 NLP 教学里的标准实验对象。
它也是一个"国家队"公司——客户名单里央企林立,资本结构里社保基金与国资在场,被美国列入实体清单后更被官方话语视为"必须支持的战略科技力量"。在中国大模型创业公司中,没有哪家比智谱更接近"国家信息基础设施"的定位。
这三重身份既是优势也是负担。学院派让它技术扎实但对市场反应略慢;开源让它社区影响力巨大但商业利润比闭源对手薄;国家队让它资金充裕但意味着在地缘政治变局里首当其冲。三种身份相互拉扯,使智谱的每一个战略选择都比纯商业公司复杂——它不能像字节豆包那样纯粹追求用户量,也不能像 DeepSeek 那样纯粹追求开源声誉。
智谱的故事是中国 AI 路径的一个缩影:从大学实验室出发,借开源建立社区,靠 ToB 拿到现金流,最终站在国家与国际的两道目光之下。它不一定能成为下一个 OpenAI,但它已经是中国"自主大模型"叙事中无法绕开的一个坐标。
到 2026 年初,无论这家公司最终走向 IPO 还是被某种形式的整合,它在 2019–2025 这六年间留下的痕迹已经清晰:把 GLM 框架写进 NLP 教科书,把 ChatGLM 写进每一个想本地跑大模型的开发者的硬盘,把"中文千亿开源大模型"这件事从无到有做成现实。这就是智谱在中国 AI 史上最值得记下的一笔。
太史公曰
智谱之兴,起于清华一隅之 KEG 实验室。唐张师徒,深耕图谱二十年,及大模型时至,乃以 GLM 一框架统理解生成于一炉,复以 ChatGPT 之风刚起,旬月之间开源 ChatGLM-6B,使天下学子有可下载之中文模型。是其速也,非一日之功。然其立身之本不在 C 端流量,而在学术、开源、央企三事鼎足而立——故一旦风波至,外有 OFAC 之制裁,内有四小龙之分化,皆不能动摇其底盘。智谱之于中国大模型,犹清华之于中国理工——非以最锋利取胜,而以最深厚立身。其能否成下一 OpenAI 未可知,然中国"自主大模型"叙事舍智谱必不能成篇。
关于智谱的最后一笔可以放在 2025 年的一份海外报告上:CSIS(战略与国际研究中心)评估中国 AI 公司"系统性风险"时,把智谱列在与 DeepSeek、阿里通义同一级。十年前,类似清单上几乎只有 BAT 三家。这种位置变化本身,就是中国 AI 这十年最简单也最锋利的注脚。
亲历者说
征集中
如果你曾在智谱 AI 或清华 KEG 实验室工作学习,欢迎提交贡献。
参考资料
- Du, Z., Qian, Y., Liu, X., Ding, M., Qiu, J., Yang, Z., & Tang, J. (2022). "GLM: General Language Model Pretraining with Autoregressive Blank Infilling." ACL 2022.
- Zeng, A., Liu, X., Du, Z., et al. (2023). "GLM-130B: An Open Bilingual Pre-trained Model." ICLR 2023.
- THUDM (2023). "ChatGLM-6B: An Open Bilingual Dialogue Language Model." GitHub: github.com/THUDM/ChatGLM-6B.
- Tang, J., et al. (2008). "ArnetMiner: Extraction and Mining of Academic Social Networks." KDD 2008.
- 智谱 AI (2024). "GLM-4 技术报告." bigmodel.cn.
- U.S. Department of the Treasury, OFAC (2025-01-15). "Treasury Sanctions Entities Supporting China's Military-Industrial Base."
- 财新周刊 (2024). "智谱 AI:清华系大模型独角兽的 ToB 路径."
- 36 氪 (2024-09). "智谱 AI 完成新一轮 30 亿元融资,估值达 200 亿."
- Wang, W., et al. (2023). "CogVLM: Visual Expert for Pretrained Language Models." arXiv:2311.03079.
- Yang, Z., et al. (2024). "CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer." arXiv:2408.06072.
- MIT Technology Review (2024). "China's Open-Source AI Strategy: The Rise of Zhipu and DeepSeek."
- 南方周末 (2025). "被列入实体清单之后:智谱 AI 的下一步."