世家 · MiniMax(海螺 AI / Talkie)
一家从商汤出走的团队,在四年里把语言、语音、视频、音乐四种模态做成一条全栈生产线——星野与 Talkie 在国内外跑出最大体量的 AI 陪伴产品,海螺视频对标 Sora,abab MoE 与 M1 推理把它推到中国大模型五虎之列。
一、闫俊杰与商汤系出身
MiniMax 的创业故事从一位"通用人工智能"的早期信徒开始。闫俊杰(Yan Junjie),清华大学本科、香港中文大学博士,师从汤晓鸥(商汤创始人)。博士期间他主攻人脸识别与深度学习,发表的多篇人脸检测与识别论文在 CVPR、ICCV 等顶会被广泛引用。毕业后他加入商汤,成为最早期的核心研究员之一,30 岁出头便升任商汤副总裁,并担任通用智能技术研究院院长——商汤体系内最早系统押注通用大模型方向的部门。
在商汤期间,闫俊杰主导了多个底层基础模型项目,包括视觉大模型与多模态预训练。他在内部被认为是"少数真正信仰 AGI"的研究者,公开演讲与采访中多次提到"AGI 的实现是这一代研究者最重要的事"。这种近乎宗教式的信念,是他后来选择从一家千亿估值的上市公司辞职出走的内驱动力。
2021 年下半年闫俊杰离开商汤。同年 12 月,他在上海创立 MiniMax,公司中文名"稀宇科技"。共同出走的还有商汤系几位关键人物:联合创始人杨斌(曾任商汤副总裁,主管商业化)担任 COO;后来加入的还有刘建昆等多位深度学习方向的工程负责人。MiniMax 的早期工程文化里带着浓厚的商汤气质——硬核工程导向、对底层基础设施投入大、相信"算力 + 数据 + 算法"是通往 AGI 的唯一路径。
公司名 MiniMax 来自博弈论中的极小化极大原理,也暗合"用最小成本实现最大智能"的工程理想。在国内大模型公司普遍以"百模大战"中被识别为追随者的 2022 年,MiniMax 是少数几家明确把目标定在"基础模型 + 多模态"上的公司——从第一天起就坚持自研底座,不做调用其他模型的应用层包装。这一选择在 2022 年被许多投资人视为"风险过高",但在 2024 年被反向证明是正确的押注。
MiniMax 早期最重要的一个判断是:在 2022 年的中国,做应用比做底座更容易,但十年后真正有价值的资产一定是底座。这一判断后来塑造了它所有的资源分配方式——大部分研发预算砸在基础模型与算力栈,而不是产品市场或销售网络。
二、abab 系列与中国第一个 MoE
MiniMax 自研模型的首个公开版本是 abab——名字取自"小白鼠"的拼音首字母重叠,自带工程实验室的戏谑感。abab-1 在 2022 年下半年内部上线,abab-2 在 2023 年初对外开放。
真正的技术宣言是 2023 年 3 月发布的 abab-MoE——中国第一个公开商用的混合专家模型(Mixture of Experts)。彼时国内主流路线仍是稠密 Transformer,MoE 在硅谷也只在 Google Switch Transformer 与早期 GPT-4 谣传中被讨论。MiniMax 选择 MoE,部分是因为闫俊杰团队判断"在算力受限的中国语境下,MoE 是更合理的扩展路径"——这一判断在 2024 年 Mistral Mixtral、DeepSeek-V2、Qwen MoE 集体出现后被市场充分追认。
之后 abab 系列演进密集:
- abab-5(2023 年 8 月):千亿参数级别。
- abab-6(2024 年 4 月):进一步扩展上下文与多语言能力,对标 GPT-4。
- abab-6.5(2024 年 9 月):MoE 架构升级,支持 200K 上下文。
- abab-7(2024 年下半年):万亿参数级 MoE,工程团队大规模升级训练栈。
- MiniMax-Text-01(2025 年 1 月):4560 亿总参数(活跃参数约 459 亿)的开源 MoE 模型,支持 400 万 token 超长上下文,论文与权重在 HuggingFace 公开。
- MiniMax-VL-01(2025 年 1 月):与 Text-01 同期发布的多模态版本。
- MiniMax-M1(2025 年 6 月):推理优化模型,官方对标 OpenAI o3 与 DeepSeek R1,是中国"推理模型潮"中的代表之一。
在 abab 与 MiniMax-Text 路线上,闫俊杰团队有一个被业内反复引用的判断:算力、参数、上下文是三个相对独立的资源轴。同等算力预算下,把活跃参数控制在中等规模、把总参数(MoE 总和)推到很大、把上下文窗口推到很长,能在大量真实场景里取得比稠密大模型更好的成本性能比。这条判断把 MiniMax 从同行中区分出来,也让它的模型在 ToB 客户那里取得不错的部署经济性。
三、星野、Talkie 与情感陪伴的全球第一
MiniMax 在 C 端的真正爆款不是通用对话,而是 AI 陪伴。
2023 年 7 月,MiniMax 在国内上线 星野——一款基于自研模型的 AI 角色陪伴 App,用户可以与虚拟角色聊天、创建自己的角色、参与剧情。早期版本叫 Glow,后改名星野。海外版本于同年以 Talkie 之名在 Google Play 与 App Store 上线,主打英文用户。
Talkie 的爆发出乎所有人的意料。2024 年其全球月活跃用户数突破千万级,在多个国家的应用商店进入娱乐榜前列,是中国 AI 出海产品中第一款真正在欧美主流市场跑出消费级体量的应用。它的对手是 character.ai——美国本土同类产品的开创者,由前 Google LaMDA 团队 Noam Shazeer 创立。Talkie 凭借更激进的角色生态、更强的女性用户黏性和更贴近 Z 世代审美的视觉,硬生生在 character.ai 的主场分到一大块蛋糕。
Talkie 的产品哲学与微信、抖音那种"国民级流量平台"完全不同——它服务的是一种私人化的、亲密的、夜间的对话需求。许多海外用户把它视为"半个朋友 + 半个心理倾诉对象"。Sensor Tower 等第三方数据显示,Talkie 的用户使用时长在所有 AI 类应用中名列前茅,单日人均使用时长一度超过半小时。这种使用强度甚至高于一般社交应用。
2024 年 8 月,character.ai 团队被 Google 以约 27 亿美元的"反向收购"打包带走,留下的市场缺口很大一部分被 Talkie 接住。在 AI 陪伴这条赛道上,2024 年下半年起 Talkie 已是事实上的全球第一。这一变化也反向影响了估值——2024 年下半年 MiniMax 与多家国际投资人接触时,Talkie 的海外营收数据是估值跳升的关键支撑之一。
四、海螺 AI:通用入口与视频生成的高光
2024 年 1 月,MiniMax 推出海螺 AI——通用对话产品的 Web 与 App 版本,对标 ChatGPT 与 Kimi,定位是"覆盖工作、学习、创作的全能助手"。海螺 AI 的差异化在两点:底座的多模态能力,以及与开放平台 API 的紧密耦合。
真正让海螺 AI 出圈的是 2024 年 9 月发布的海螺 video——MiniMax 自研的视频生成模型。在 OpenAI Sora 2024 年 2 月演示后,全球都在追赶,但能稳定开放给消费者使用的视频模型寥寥无几。海螺 video 是中国第一个在消费端大规模可用的高质量视频生成产品,单条 6 秒视频生成时间数十秒,物理一致性、运动连贯性、人物表情都达到当时业界领先水平。一时间海外社交媒体上 #HailuoAI 标签下涌现大量创作者作品,TechCrunch、The Verge 都做过专题报道。
到 2025 年,MiniMax 的多模态全栈已全部就位:
- 文本:abab 系列 + MiniMax-Text-01 + M1 推理模型;
- 语音:speech-01、speech-02 高拟真语音合成与克隆,被业界评为接近 ElevenLabs 的中文方案;
- 视频:海螺 video / T2V 文生视频 + I2V 图生视频;
- 音乐:music-01 文生音乐模型。
这套矩阵让 MiniMax 成为中国少数把"模型即产品"做到端到端打通的公司——从基础模型到 API 平台到 C 端 App,每一层都自研。在中文大模型公司里,唯一能与之全面对位的是字节跳动豆包系列;而在创业公司中,没有第二家做到这种全栈深度。
值得一提的是 MiniMax 的开放平台 platform.minimaxi.com——它面向企业开发者提供文本、语音、视频、音乐四类 API,被国内大量短视频公司、有声书厂商、内容创作工具采用。语音与视频接口在 2024 年下半年贡献了 MiniMax 不容忽视的 ToB 营收。
五、资本:阿里、腾讯、米哈游与红杉
MiniMax 的融资史在中国大模型公司里相当独特——它把互联网巨头、游戏公司与顶级美元基金同时拉进了股东名单。
- 2022–2023 年早期轮次:高瓴、IDG、米哈游(异军突起的游戏公司)等参与,米哈游对 AI 陪伴方向的兴趣让这笔投资颇具象征意义;
- 2024 年 A 轮:阿里巴巴领投,腾讯、红杉中国跟投,估值约 25 亿美元;
- 2025 年新一轮:估值升至约 40 亿美元,跻身中国 AI 公司估值前列。
阿里巴巴是最深度的战略投资人——它同时投资了智谱、月之暗面、零一万物、百川智能、MiniMax,几乎押注了所有头部大模型创业公司。米哈游的存在则提示了 MiniMax 与游戏 / 二次元 / 角色生成场景的天然亲和。
从 2024 年底起,市场不断传出 MiniMax 筹备港股 IPO 的消息,2025 年仍在持续推进。如果上市顺利,它很可能与智谱并列成为中国第一批登陆资本市场的大模型公司。这对国内 AI 行业的估值体系将是一次关键的"市价发现"——目前所有大模型公司的估值都在一级市场议价,缺少二级市场的真实定价。
MiniMax 的资本叙事里还有一个特殊变量:海外营收占比。Talkie 的存在让它成为少数对美元投资人有真实"美元收入"故事的中国 AI 公司,这一点在 2025 年中美 AI 资本市场分化的背景下尤其重要。
六、技术路线:MoE、长上下文与多模态原生
回到技术。MiniMax 的研究路线有三个鲜明的关键词。
MoE 为底。从 abab-MoE 到 Text-01,MiniMax 是中国最早押注 MoE 路线的团队,比 DeepSeek-V2 早一年多。MoE 架构让它在算力受限的环境下能把"等效参数量"推到万亿规模,这一选择被 2024–2025 年全球 MoE 浪潮充分验证。
超长上下文。MiniMax-Text-01 支持 400 万 token 的上下文窗口——是当时全球开源模型最长之一,也是 Kimi 200 万字上下文路线的进一步延伸。MiniMax 提出的 Lightning Attention 与混合注意力机制,使长序列推理的成本控制在工程可行范围。
多模态原生。MiniMax 不是先做语言模型再加视觉,而是从架构层面把语音、视觉、视频与语言放在同一套基础设施上协同训练。海螺 video、speech 系列、music 系列共享底层算力栈,这套全栈布局让它在 2024 年的多模态竞赛中没有掉队。
这三条路线的共同点是:每一条都是"在算力受限条件下追求全模态最大覆盖"。这正好对应了它公司名背后的博弈论思路——在最差对手与最差条件下,把自己的最差表现最大化。
七、作为机构的 MiniMax
回到 MiniMax 本身:在中国大模型五虎(字节豆包、智谱、月之暗面、DeepSeek、MiniMax)里,它的位置最难定义。
它不是字节豆包那样的巨头内置部门,没有 6 亿日活的分发底盘;它不是智谱那样的"国家队 + 学院派",没有清华系的官方光环;它不是月之暗面那样的"投流型 ToC 单品",没有把全部筹码压在一个产品;它也不是 DeepSeek 那样的"纯研究路线 + 极致开源",不愿放弃商业化。
它走的是一条"全栈自研 + 多模态 + 全球化"的路线——既做底层 MoE 基础模型,又做语音视频音乐,又把 ToC 产品同时跑到国内(星野)与海外(Talkie),还在 ToB 平台上开放 API。这条路线的代价是战线极长,要求工程能力、产品能力、出海能力同时在线;红利则是一旦做成,就同时占据多个赛道的头部位置。
到 2026 年,MiniMax 已经在三条战线上分别拿下了关键位置:AI 陪伴全球第一(Talkie)、消费级视频生成中国领先(海螺 video)、长上下文 + MoE 中国头部(Text-01 / M1)。它不一定是中国最大的 AI 公司,但很可能是中国 AI 出海最成功的那一家。
也正因如此,MiniMax 的故事在中国 AI 史上的位置不仅是技术线索,更是一条"产品出海线索"——继 TikTok、SHEIN、原神之后,AI 应用层在欧美主流市场首次跑出真正意义上的中国名字。这条线索的份量,比一两个模型版本要长远得多。
太史公曰
MiniMax 起于商汤一支偏师,闫俊杰携汤门旧部南下上海,立"稀宇"之号,志在 AGI。其用兵之异有三:一曰早押 MoE,于稠密 Transformer 当道之时独行偏路,三年而风从之;二曰多模态全栈并举,文本语音视频音乐四军并进,无一掉队;三曰国内海外两线作战,星野固守内池,Talkie 出海击 character.ai 之主场而胜之。其阵之广,列国未有。然战线之长亦其困——既要做底座,又要做产品,又要做出海,每一线皆需顶尖人才与无尽算力。MiniMax 之未来,系于能否在五虎并立之中以"全栈自研 + 全球用户"两项护城河立身。若成,则中国大模型有第一个真正意义上的国际消费品牌;若不成,亦不过分散用力之憾。但仅以 Talkie 一项已可入史——它证明了中国 AI 在欧美主流市场可以是第一名,而非追随者。
作为机构的 MiniMax 还有一个常被忽略的特质:它是国内大模型公司里"研究公开度"较高的几家之一。从 abab-MoE 开始,关键模型都伴随技术报告或论文发布,MiniMax-01 系列更是完整开源权重与训练细节。这种学术公开是它在欧美研究圈被广泛讨论的重要原因——它不是一个只会做产品的中国公司,而是一个在 NeurIPS、ICLR 论文 review 中真实出现的玩家。
到 2026 年,MiniMax 是否能成为"中国第一家全球化 AI 公司"仍未有定论,但路径已经清晰:底座、产品、海外,三条腿同时站立。在中国 AI 公司史上能这样三足并立的,目前只有它一家。
闫俊杰本人极少公开露面,更不与同行打口水仗,这种克制让 MiniMax 在中国 AI 创业圈显得格外低调。但低调不等于没野心——它要做的事情是中国 AI 公司里最大的一件:成为一家全球化的、自有用户基础的、覆盖全模态的 AI 公司。
亲历者说
征集中
如果你曾在 MiniMax 工作或参与过 Talkie / 海螺的研发与运营,欢迎提交贡献。
参考资料
- MiniMax (2025). "MiniMax-01: Scaling Foundation Models with Lightning Attention." arXiv:2501.08313.
- MiniMax (2025). "MiniMax-M1: Open-Sourcing the World's Most Efficient Reasoning Model." minimax.io 技术博客.
- 财新 (2024). "MiniMax 闫俊杰:从商汤副总裁到大模型五虎."
- 36 氪 (2024). "Talkie 海外月活破千万:中国 AI 出海第一爆款是怎么炼成的."
- The Information (2024). "China's MiniMax Is Quietly Beating Character.AI Overseas."
- TechCrunch (2024-09). "Hailuo AI Video: China's Answer to Sora Goes Public."
- The Verge (2024). "Hailuo's Video Model Is Surprisingly Good — and Free."
- 南方周末 (2024). "AI 陪伴的国民级产品:星野与 Talkie 的两条战线."
- 财经 (2025). "MiniMax 港股 IPO 进程追踪."
- Sensor Tower (2024). "Top AI Companion Apps Worldwide: Q3 2024 Report."
- Bloomberg (2025). "Alibaba's Bet on Every Chinese AI Unicorn."
- MiniMax 开放平台技术文档 (2024–2025). platform.minimaxi.com.