世家 · MiniMax（海螺 AI / Talkie）

一家从商汤出走的团队，在四年里把语言、语音、视频、音乐四种模态做成一条全栈生产线——星野与 Talkie 在国内外跑出最大体量的 AI 陪伴产品，海螺视频对标 Sora，abab MoE 与 M1 推理把它推到中国大模型五虎之列。

一、闫俊杰与商汤系出身

MiniMax 的创业故事从一位"通用人工智能"的早期信徒开始。闫俊杰（Yan Junjie），清华大学本科、香港中文大学博士，师从汤晓鸥（商汤创始人）。博士期间他主攻人脸识别与深度学习，发表的多篇人脸检测与识别论文在 CVPR、ICCV 等顶会被广泛引用。毕业后他加入商汤，成为最早期的核心研究员之一，30 岁出头便升任商汤副总裁，并担任通用智能技术研究院院长——商汤体系内最早系统押注通用大模型方向的部门。

在商汤期间，闫俊杰主导了多个底层基础模型项目，包括视觉大模型与多模态预训练。他在内部被认为是"少数真正信仰 AGI"的研究者，公开演讲与采访中多次提到"AGI 的实现是这一代研究者最重要的事"。这种近乎宗教式的信念，是他后来选择从一家千亿估值的上市公司辞职出走的内驱动力。

2021 年下半年闫俊杰离开商汤。同年 12 月，他在上海创立 MiniMax，公司中文名"稀宇科技"。共同出走的还有商汤系几位关键人物：联合创始人杨斌（曾任商汤副总裁，主管商业化）担任 COO；后来加入的还有刘建昆等多位深度学习方向的工程负责人。MiniMax 的早期工程文化里带着浓厚的商汤气质——硬核工程导向、对底层基础设施投入大、相信"算力 + 数据 + 算法"是通往 AGI 的唯一路径。

公司名 MiniMax 来自博弈论中的极小化极大原理，也暗合"用最小成本实现最大智能"的工程理想。在国内大模型公司普遍以"百模大战"中被识别为追随者的 2022 年，MiniMax 是少数几家明确把目标定在"基础模型 + 多模态"上的公司——从第一天起就坚持自研底座，不做调用其他模型的应用层包装。这一选择在 2022 年被许多投资人视为"风险过高"，但在 2024 年被反向证明是正确的押注。

MiniMax 早期最重要的一个判断是：在 2022 年的中国，做应用比做底座更容易，但十年后真正有价值的资产一定是底座。这一判断后来塑造了它所有的资源分配方式——大部分研发预算砸在基础模型与算力栈，而不是产品市场或销售网络。

二、abab 系列与中国第一个 MoE

MiniMax 自研模型的首个公开版本是 abab——名字取自"小白鼠"的拼音首字母重叠，自带工程实验室的戏谑感。abab-1 在 2022 年下半年内部上线，abab-2 在 2023 年初对外开放。

真正的技术宣言是 2023 年 3 月发布的 abab-MoE——中国第一个公开商用的混合专家模型（Mixture of Experts）。彼时国内主流路线仍是稠密 Transformer，MoE 在硅谷也只在 Google Switch Transformer 与早期 GPT-4 谣传中被讨论。MiniMax 选择 MoE，部分是因为闫俊杰团队判断"在算力受限的中国语境下，MoE 是更合理的扩展路径"——这一判断在 2024 年 Mistral Mixtral、DeepSeek-V2、Qwen MoE 集体出现后被市场充分追认。

之后 abab 系列演进密集：

abab-5（2023 年 8 月）：千亿参数级别。
abab-6（2024 年 4 月）：进一步扩展上下文与多语言能力，对标 GPT-4。
abab-6.5（2024 年 9 月）：MoE 架构升级，支持 200K 上下文。
abab-7（2024 年下半年）：万亿参数级 MoE，工程团队大规模升级训练栈。
MiniMax-Text-01（2025 年 1 月）：4560 亿总参数（活跃参数约 459 亿）的开源 MoE 模型，支持 400 万 token 超长上下文，论文与权重在 HuggingFace 公开。
MiniMax-VL-01（2025 年 1 月）：与 Text-01 同期发布的多模态版本。
MiniMax-M1（2025 年 6 月）：推理优化模型，官方对标 OpenAI o3 与 DeepSeek R1，是中国"推理模型潮"中的代表之一。

在 abab 与 MiniMax-Text 路线上，闫俊杰团队有一个被业内反复引用的判断：算力、参数、上下文是三个相对独立的资源轴。同等算力预算下，把活跃参数控制在中等规模、把总参数（MoE 总和）推到很大、把上下文窗口推到很长，能在大量真实场景里取得比稠密大模型更好的成本性能比。这条判断把 MiniMax 从同行中区分出来，也让它的模型在 ToB 客户那里取得不错的部署经济性。

三、星野、Talkie 与情感陪伴的全球第一

MiniMax 在 C 端的真正爆款不是通用对话，而是 AI 陪伴。

2023 年 7 月，MiniMax 在国内上线星野——一款基于自研模型的 AI 角色陪伴 App，用户可以与虚拟角色聊天、创建自己的角色、参与剧情。早期版本叫 Glow，后改名星野。海外版本于同年以 Talkie 之名在 Google Play 与 App Store 上线，主打英文用户。

Talkie 的爆发出乎所有人的意料。2024 年其全球月活跃用户数突破千万级，在多个国家的应用商店进入娱乐榜前列，是中国 AI 出海产品中第一款真正在欧美主流市场跑出消费级体量的应用。它的对手是 character.ai——美国本土同类产品的开创者，由前 Google LaMDA 团队 Noam Shazeer 创立。Talkie 凭借更激进的角色生态、更强的女性用户黏性和更贴近 Z 世代审美的视觉，硬生生在 character.ai 的主场分到一大块蛋糕。

Talkie 的产品哲学与微信、抖音那种"国民级流量平台"完全不同——它服务的是一种私人化的、亲密的、夜间的对话需求。许多海外用户把它视为"半个朋友 + 半个心理倾诉对象"。Sensor Tower 等第三方数据显示，Talkie 的用户使用时长在所有 AI 类应用中名列前茅，单日人均使用时长一度超过半小时。这种使用强度甚至高于一般社交应用。

2024 年 8 月，character.ai 团队被 Google 以约 27 亿美元的"反向收购"打包带走，留下的市场缺口很大一部分被 Talkie 接住。在 AI 陪伴这条赛道上，2024 年下半年起 Talkie 已是事实上的全球第一。这一变化也反向影响了估值——2024 年下半年 MiniMax 与多家国际投资人接触时，Talkie 的海外营收数据是估值跳升的关键支撑之一。

四、海螺 AI：通用入口与视频生成的高光

2024 年 1 月，MiniMax 推出海螺 AI——通用对话产品的 Web 与 App 版本，对标 ChatGPT 与 Kimi，定位是"覆盖工作、学习、创作的全能助手"。海螺 AI 的差异化在两点：底座的多模态能力，以及与开放平台 API 的紧密耦合。

真正让海螺 AI 出圈的是 2024 年 9 月发布的海螺 video——MiniMax 自研的视频生成模型。在 OpenAI Sora 2024 年 2 月演示后，全球都在追赶，但能稳定开放给消费者使用的视频模型寥寥无几。海螺 video 是中国第一个在消费端大规模可用的高质量视频生成产品，单条 6 秒视频生成时间数十秒，物理一致性、运动连贯性、人物表情都达到当时业界领先水平。一时间海外社交媒体上 #HailuoAI 标签下涌现大量创作者作品，TechCrunch、The Verge 都做过专题报道。

到 2025 年，MiniMax 的多模态全栈已全部就位：

文本：abab 系列 + MiniMax-Text-01 + M1 推理模型；
语音：speech-01、speech-02 高拟真语音合成与克隆，被业界评为接近 ElevenLabs 的中文方案；
视频：海螺 video / T2V 文生视频 + I2V 图生视频；
音乐：music-01 文生音乐模型。

这套矩阵让 MiniMax 成为中国少数把"模型即产品"做到端到端打通的公司——从基础模型到 API 平台到 C 端 App，每一层都自研。在中文大模型公司里，唯一能与之全面对位的是字节跳动豆包系列；而在创业公司中，没有第二家做到这种全栈深度。

值得一提的是 MiniMax 的开放平台 platform.minimaxi.com——它面向企业开发者提供文本、语音、视频、音乐四类 API，被国内大量短视频公司、有声书厂商、内容创作工具采用。语音与视频接口在 2024 年下半年贡献了 MiniMax 不容忽视的 ToB 营收。

五、资本：阿里、腾讯、米哈游与红杉

MiniMax 的融资史在中国大模型公司里相当独特——它把互联网巨头、游戏公司与顶级美元基金同时拉进了股东名单。

2022–2023 年早期轮次：高瓴、IDG、米哈游（异军突起的游戏公司）等参与，米哈游对 AI 陪伴方向的兴趣让这笔投资颇具象征意义；
2024 年 A 轮：阿里巴巴领投，腾讯、红杉中国跟投，估值约 25 亿美元；
2025 年新一轮：估值升至约 40 亿美元，跻身中国 AI 公司估值前列。

阿里巴巴是最深度的战略投资人——它同时投资了智谱、月之暗面、零一万物、百川智能、MiniMax，几乎押注了所有头部大模型创业公司。米哈游的存在则提示了 MiniMax 与游戏 / 二次元 / 角色生成场景的天然亲和。

从 2024 年底起，市场不断传出 MiniMax 筹备港股 IPO 的消息，2025 年仍在持续推进。如果上市顺利，它很可能与智谱并列成为中国第一批登陆资本市场的大模型公司。这对国内 AI 行业的估值体系将是一次关键的"市价发现"——目前所有大模型公司的估值都在一级市场议价，缺少二级市场的真实定价。

MiniMax 的资本叙事里还有一个特殊变量：海外营收占比。Talkie 的存在让它成为少数对美元投资人有真实"美元收入"故事的中国 AI 公司，这一点在 2025 年中美 AI 资本市场分化的背景下尤其重要。

六、技术路线：MoE、长上下文与多模态原生

回到技术。MiniMax 的研究路线有三个鲜明的关键词。

MoE 为底。从 abab-MoE 到 Text-01，MiniMax 是中国最早押注 MoE 路线的团队，比 DeepSeek-V2 早一年多。MoE 架构让它在算力受限的环境下能把"等效参数量"推到万亿规模，这一选择被 2024–2025 年全球 MoE 浪潮充分验证。

超长上下文。MiniMax-Text-01 支持 400 万 token 的上下文窗口——是当时全球开源模型最长之一，也是 Kimi 200 万字上下文路线的进一步延伸。MiniMax 提出的 Lightning Attention 与混合注意力机制，使长序列推理的成本控制在工程可行范围。

多模态原生。MiniMax 不是先做语言模型再加视觉，而是从架构层面把语音、视觉、视频与语言放在同一套基础设施上协同训练。海螺 video、speech 系列、music 系列共享底层算力栈，这套全栈布局让它在 2024 年的多模态竞赛中没有掉队。

这三条路线的共同点是：每一条都是"在算力受限条件下追求全模态最大覆盖"。这正好对应了它公司名背后的博弈论思路——在最差对手与最差条件下，把自己的最差表现最大化。

七、作为机构的 MiniMax

回到 MiniMax 本身：在中国大模型五虎（字节豆包、智谱、月之暗面、DeepSeek、MiniMax）里，它的位置最难定义。

它不是字节豆包那样的巨头内置部门，没有 6 亿日活的分发底盘；它不是智谱那样的"国家队 + 学院派"，没有清华系的官方光环；它不是月之暗面那样的"投流型 ToC 单品"，没有把全部筹码压在一个产品；它也不是 DeepSeek 那样的"纯研究路线 + 极致开源"，不愿放弃商业化。

它走的是一条"全栈自研 + 多模态 + 全球化"的路线——既做底层 MoE 基础模型，又做语音视频音乐，又把 ToC 产品同时跑到国内（星野）与海外（Talkie），还在 ToB 平台上开放 API。这条路线的代价是战线极长，要求工程能力、产品能力、出海能力同时在线；红利则是一旦做成，就同时占据多个赛道的头部位置。

到 2026 年，MiniMax 已经在三条战线上分别拿下了关键位置：AI 陪伴全球第一（Talkie）、消费级视频生成中国领先（海螺 video）、长上下文 + MoE 中国头部（Text-01 / M1）。它不一定是中国最大的 AI 公司，但很可能是中国 AI 出海最成功的那一家。

也正因如此，MiniMax 的故事在中国 AI 史上的位置不仅是技术线索，更是一条"产品出海线索"——继 TikTok、SHEIN、原神之后，AI 应用层在欧美主流市场首次跑出真正意义上的中国名字。这条线索的份量，比一两个模型版本要长远得多。

太史公曰

MiniMax 起于商汤一支偏师，闫俊杰携汤门旧部南下上海，立"稀宇"之号，志在 AGI。其用兵之异有三：一曰早押 MoE，于稠密 Transformer 当道之时独行偏路，三年而风从之；二曰多模态全栈并举，文本语音视频音乐四军并进，无一掉队；三曰国内海外两线作战，星野固守内池，Talkie 出海击 character.ai 之主场而胜之。其阵之广，列国未有。然战线之长亦其困——既要做底座，又要做产品，又要做出海，每一线皆需顶尖人才与无尽算力。MiniMax 之未来，系于能否在五虎并立之中以"全栈自研 + 全球用户"两项护城河立身。若成，则中国大模型有第一个真正意义上的国际消费品牌；若不成，亦不过分散用力之憾。但仅以 Talkie 一项已可入史——它证明了中国 AI 在欧美主流市场可以是第一名，而非追随者。

作为机构的 MiniMax 还有一个常被忽略的特质：它是国内大模型公司里"研究公开度"较高的几家之一。从 abab-MoE 开始，关键模型都伴随技术报告或论文发布，MiniMax-01 系列更是完整开源权重与训练细节。这种学术公开是它在欧美研究圈被广泛讨论的重要原因——它不是一个只会做产品的中国公司，而是一个在 NeurIPS、ICLR 论文 review 中真实出现的玩家。

到 2026 年，MiniMax 是否能成为"中国第一家全球化 AI 公司"仍未有定论，但路径已经清晰：底座、产品、海外，三条腿同时站立。在中国 AI 公司史上能这样三足并立的，目前只有它一家。

闫俊杰本人极少公开露面，更不与同行打口水仗，这种克制让 MiniMax 在中国 AI 创业圈显得格外低调。但低调不等于没野心——它要做的事情是中国 AI 公司里最大的一件：成为一家全球化的、自有用户基础的、覆盖全模态的 AI 公司。

亲历者说

征集中

如果你曾在 MiniMax 工作或参与过 Talkie / 海螺的研发与运营，欢迎提交贡献。

参考资料

MiniMax (2025). "MiniMax-01: Scaling Foundation Models with Lightning Attention." arXiv:2501.08313.
MiniMax (2025). "MiniMax-M1: Open-Sourcing the World's Most Efficient Reasoning Model." minimax.io 技术博客.
财新 (2024). "MiniMax 闫俊杰：从商汤副总裁到大模型五虎."
36 氪 (2024). "Talkie 海外月活破千万：中国 AI 出海第一爆款是怎么炼成的."
The Information (2024). "China's MiniMax Is Quietly Beating Character.AI Overseas."
TechCrunch (2024-09). "Hailuo AI Video: China's Answer to Sora Goes Public."
The Verge (2024). "Hailuo's Video Model Is Surprisingly Good — and Free."
南方周末 (2024). "AI 陪伴的国民级产品：星野与 Talkie 的两条战线."
财经 (2025). "MiniMax 港股 IPO 进程追踪."
Sensor Tower (2024). "Top AI Companion Apps Worldwide: Q3 2024 Report."
Bloomberg (2025). "Alibaba's Bet on Every Chinese AI Unicorn."
MiniMax 开放平台技术文档 (2024–2025). platform.minimaxi.com.

世家 · MiniMax（海螺 AI / Talkie） ​

一、闫俊杰与商汤系出身 ​

二、abab 系列与中国第一个 MoE ​

三、星野、Talkie 与情感陪伴的全球第一 ​

四、海螺 AI：通用入口与视频生成的高光 ​

五、资本：阿里、腾讯、米哈游与红杉 ​

六、技术路线：MoE、长上下文与多模态原生 ​

七、作为机构的 MiniMax ​

亲历者说 ​

参考资料 ​