世家 · 字节跳动 / Seed AI Lab(豆包)
一家以推荐算法立命的内容公司,在大模型时代用最快的速度、最低的价格和最庞大的分发渠道,把 AI 推向了中国最广泛的消费级用户。
一、推荐算法的"原始资本"
2012 年 3 月 9 日,张一鸣(Yiming Zhang)与梁汝波(Liang Rubo)在北京海淀知春路一栋租来的居民楼里创办了北京字节跳动科技有限公司。
同年 8 月,"今日头条"App 上线。它的产品形态在当时的中国互联网里是异类——没有编辑、没有频道、没有用户主动订阅,所有内容都由一套机器学习推荐系统决定。
这套推荐系统是后来字节所有 AI 故事的真正原点。它不依赖 Google 式的搜索意图,而依赖大规模用户行为日志——点击、停留时长、完播率、互动——通过协同过滤、矩阵分解、深度神经网络逐代演进,最终演化为今日抖音 / TikTok 背后那个被反复研究、反复模仿、却从未被完全复制的推荐引擎。
抖音 2016 年 9 月上线,TikTok 2017 年 5 月作为海外版推出。2018 年 8 月字节斥资约 10 亿美元收购 Musical.ly 并整合进 TikTok,全球化引擎正式启动。
在西方互联网公司的视角里,字节是"那个用算法颠覆 Instagram 和 YouTube 的中国公司";但从内部视角看,它从一开始就是一家算法即产品的公司。
这一点决定了它日后转向大模型的门槛:算力、数据、推荐系统级的工程经验,它一样都不缺。
Meta 在 Reels 上花费了三年才把推荐系统迭代到接近 TikTok 的水平,YouTube 至今没有把短视频做到能压过 TikTok 的程度——这不是巧合,是字节十年算法投入的复利。
二、AI Lab 的早期布阵
2016 年,字节成立 AI Lab,最初由马维英(Wei-Ying Ma,前微软亚洲研究院常务副院长)与吴恩达团队前同事李航(Hang Li,《统计学习方法》作者、前华为诺亚方舟实验室主任)领衔。
AI Lab 的早期重点是 NLP、机器翻译、推荐系统、计算机视觉等支撑业务的方向,研究成果直接接入头条、抖音、Lark(飞书)、火山引擎等产品线。
2017 年起字节开始大量招募海外华人研究员;2018 年成立美国研究院(Bytedance AI Lab US,落在 Mountain View)、2019 年成立英国研究院(伦敦)。
2020 年 7 月,原腾讯 AI Lab 主任、香港科大教授张潼(Tong Zhang)加入字节,接任 AI Lab 主任,让字节的 AI 研究在学术影响力上向第一梯队靠拢。
但与百度、阿里不同,字节对外极少强调"AI 研究院"这块招牌。
在张一鸣式的"理性、克制、低姿态"内部文化下,AI Lab 的成果更多藏在产品背后——TikTok 的内容理解、剪映(CapCut)的智能剪辑、Lark 的会议总结、巨量引擎的广告投放预测。直到 2022 年 ChatGPT 出现,字节才不得不把 AI 推到台前。
三、Seed 的成立——大模型转身
ChatGPT 之后,字节内部对大模型的反应起初并不算快。2023 年初公司内部的判断是:"等一等,看看路线再下注。"
几个月后情势明朗:百度文心一言、阿里通义千问、智谱 GLM、月之暗面 Kimi 已经把第一波牌桌占住了。字节决定一次性砸到底。
2023 年下半年起,字节内部整合 AI Lab 中的大模型方向团队,并大手笔从 Google DeepMind、OpenAI、阿里、百度等机构挖角。2024 年初,字节正式将豆包大模型团队独立为 Seed 团队——名字取意"种子",强调研究的长期投入。
Seed 由原谷歌 DeepMind 高级研究员 朱文佳(Wenjia Zhu) 担任负责人,前谷歌研究员 吴永辉(Yonghui Wu,前 Google Brain / Translate 高管) 加盟担任研究副总裁。资深研究员包括项亮(前阿里达摩院、《推荐系统实践》作者)、马杰、Jimmy Ma 等。
2024 年公开报道里,字节用于挖角顶级研究员的薪资包屡屡刷新中国科技公司的历史——年薪过千万人民币的 offer 不再是少数,部分头部研究员获得的多年期薪酬包接近五千万元人民币。
字节由此在 2024–2025 年成为中国 AI 人才市场最活跃的买家,没有之一。它甚至从 OpenAI、Anthropic、DeepMind 直接挖人,让北美 AI 圈第一次开始认真讨论"中国公司用绝对薪资差距挖走我们的工程师"这件事。
四、豆包——To C 的胜负手
字节的大模型路径与百度、阿里很不一样:先 toC,再 toB。
2024 年 5 月 15 日,火山引擎"原动力大会"上,字节正式发布豆包大模型家族(Doubao),包括通用模型 Pro / Lite、角色扮演、Function Call、向量化、文生图等共九个模型。
当天最震动业界的不是模型本身,而是定价:豆包 Pro 32K 的输入价格为 0.8 元 / 百万 tokens,比当时国内同档位模型便宜了一个数量级,比 GPT-4 便宜约 99%。
这是 2024 年中国大模型价格战的发令枪——百度、阿里、智谱、腾讯混元在随后两个月内全部跟进降价,部分模型直接免费。"Token 卷出白菜价"成了那一年的主题词。
一些创业公司创始人事后承认,如果没有字节这一刀,他们不会被迫调整商业模式,反而 token 价格会维持在原本不可持续的高位上更久。
价格之外,字节真正的杀手锏是分发。豆包 App(Doubao 海外版 Cici)2023 年 8 月上线,借助今日头条、抖音、巨量引擎的全平台投放,在 2024 年迅速成长为中国月活第一的对话式 AI 助手。
QuestMobile / Sensor Tower 数据显示,2024 年 9 月豆包 App 中国 MAU 突破 4700 万,2025 年初突破 8000 万;全年广告投放规模在所有 AI 应用中排名第一。把 AI 当流量产品打的逻辑,字节比任何对手都更熟练。
2024–2025 年,豆包系列以平均每两到三个月一个版本的速度迭代:豆包 Pro 1.5(2025 年 1 月,上下文 256K,多模态 MoE)、豆包 Vision、豆包 1.5 Pro、豆包视频生成 Seedance、豆包同声传译、豆包深度思考。海外侧 Cici、Coze(扣子)、Gauth(解题应用)覆盖东南亚、北美、印尼等市场。
五、火山方舟与 ToB 闭环
豆包面向消费者,火山方舟(Volcano Ark)面向开发者与企业。2023 年 6 月推出,是字节在火山引擎之上提供的模型托管平台。
它从一开始就采取"自家豆包 + 第三方模型"双轨架构——既托管豆包系列,也托管 MiniMax、智谱、月之暗面、百川等同行的模型,统一计费、统一 SDK。这种"既当运动员又当裁判"的开放姿态在大厂里并不常见,是字节争夺中国 MaaS 市场的重要筹码。
火山方舟之上还有 Coze(扣子)——字节的 Agent 平台,对标 OpenAI GPTs。
2024 年起 Coze 开放给个人开发者免费使用,海外版 Coze.com 同步上线,并把模型源切换为 OpenAI / Claude 等海外模型。这种"国内国外双 SKU"的产品策略,是字节多年全球化运营经验的延续。
到了 2025 年,火山引擎在中国公有云大模型 API 调用量上稳居第一,单日 token 处理量达到万亿级——这一数字反过来又为豆包训练提供了庞大的真实场景反馈。
火山引擎也由此从"字节的内部云"变成"中国 AI 时代第一个真正具备规模 MaaS 收入的云厂商"。
六、Seed 的研究——从模型到视频
进入 2025 年,Seed 的研究输出开始密集面向公众。
- Seed1.5 / Seed1.6(2025 年):字节自家的旗舰对话与推理模型,多次在 LMSYS 中文榜进入第一梯队。
- Seed-VL(2025 年):原生多模态大模型,覆盖图像、视频、文档理解。
- Seed-OSS(2025 年 8 月):Seed 团队首次开源的 36B 规模基础模型,权重协议商业可用,是字节在"开源 vs 闭源"路线上的态度试探。
- PixelDance(2024 年)与 Seedance(2025 年):视频生成模型,最长可生成 10 秒以上高一致性视频,是字节在 Sora 之后中国侧最有竞争力的视频生成模型之一。
- Seaweed(2025 年):字节自家的视频生成基础研究项目,强调长时一致性与动作流畅性,部分能力下沉到剪映和 TikTok 的创作工具。
字节内部对 AGI 的判断更偏务实:朱文佳在 2024 年的一次内部分享里说,Seed 不追"PR 级别的 SOTA",而追"放进抖音、TikTok、Lark、剪映里能立刻跑起来的 SOTA"。这是典型的字节式优先级——研究不是为了得分,而是为了让产品下一个迭代周期能多解一道题。
七、字节式打法
回望 2012–2026 这十四年,字节跳动是中国互联网公司里"最不像 AI 公司却最 AI"的那一家。
它没有像百度那样喊"All in AI"喊得最早,没有像阿里那样办过"达摩院发布会",但它把推荐算法、信息流、视频生成、对话式 AI 一项一项接到自家分发引擎上,让 AI 在中国第一次以消费级日常工具的形态走进每一部手机。
它的打法在国内可以用三句话概括:模型够好就行、价格压到地板、分发用足全部弹药。
这种打法激起了对手的不适,也激起了"字节模式能否在严肃 AI 上奏效"的争论——但事实是,2024–2025 年间中国大模型 API 调用量、消费级 AI 助手 MAU 这两项最重要的工业指标,字节都在第一名。
截至 2025 年底,字节跳动以约 4000 亿美元估值(一级市场二级转手价格)超越腾讯,成为中国市值最高的互联网公司之一——尚未上市,已是巨擘。
它的故事并不浪漫——没有马斯克式的口号,没有奥特曼式的劝世文,没有马云式的禅意——但它对中国 AI 产业的影响,可能是 2024 年之后最直接的:当一家公司决定把所有筹码压在分发与价格上,整个市场会被迫一起调整呼吸的节奏。
太史公曰
字节之兴,始于推荐之算法,盛于抖音、TikTok 之分发;及大模型之世,乃以最低之价、最广之渠、最厚之囊,强势入局。其入也晚——较百度晚十年方建研究之名;较阿里晚一年方设 Seed 之团——然其势猛而准:豆包定价一出,举国大模型皆从而降;豆包 App 一上,国内 AI 助手月活之首易主。研究之事,字节素不声张,今亦不喜以"AGI"为口号,唯求其模型可入抖音、可入剪映、可入 Lark、可入海外之 Cici 与 Coze。论其功,使 AI 由实验室之物变为日用之器;论其失,使中国大模型 API 利润几无可言;论其势,正未有艾。后世之论字节者,必当先论其推荐之根、再论其分发之翼、终论其低价之刃——三者合一,乃成今日之 Seed。
亲历者说
征集中
如果你曾在字节跳动 AI Lab、Seed 或火山引擎团队工作,欢迎提交贡献。
参考资料
- 张一鸣(2018)。"字节跳动六周年内部信",公开版本经多家媒体转载。
- ByteDance Seed (2024). "Doubao Pro Technical Report." 火山引擎技术博客。
- ByteDance Seed (2025). "Seed-OSS-36B Technical Report." Hugging Face / GitHub 发布说明。
- ByteDance (2023). "PixelDance: High-Dynamic Video Generation." arXiv:2311.10982 及后续技术报告。
- 火山引擎原动力大会(2024 年 5 月 15 日)发布会现场实录,36 氪、第一财经报道。
- 财新(2024)。《字节大模型简史:朱文佳、吴永辉与 Seed 的诞生》。
- The Information(2024)。"How ByteDance Is Spending Billions to Catch Up on AI."
- QuestMobile(2024 年 12 月)。"中国移动互联网生成式 AI 应用月报"。
- Sensor Tower(2025 年 1 月)。"Top AI Apps Worldwide: Doubao, Cici, ChatGPT."
- 字节跳动(2024)。"Coze 智能体平台开发者文档",coze.cn / coze.com。
- Bloomberg(2025 年)。"ByteDance Valuation Tops Tencent in Secondary Market."
- 李航(2012)。《统计学习方法》。清华大学出版社(背景资料)。
- 项亮(2012)。《推荐系统实践》。人民邮电出版社(背景资料)。
