世家 · 亚马逊(AWS AI / Bedrock)
全球最大的云厂商在大模型时代的生存法则——不押注自研顶级模型,而要做所有顶级模型的通用底座;80 亿美元投资 Anthropic,是 AWS 在 2020 年代最重要的一步棋。
一、云的底子
要理解 AWS 在 AI 时代的位置,需要先理解它原本就是什么。2006 年 3 月 14 日,亚马逊推出 Simple Storage Service(S3);同年 8 月 24 日推出 Elastic Compute Cloud(EC2 Beta)。这两件产品合在一起,让"云计算"从概念变成了商品。奥特曼创业时第一次刷信用卡租的服务器、Anthropic 训练 Claude 用的 H100 集群、Hugging Face Hub 上每一次模型下载——这些事情背后共同的基础设施母体,都可以追溯到 AWS 在西雅图地下机房里那几排早期机器。
AWS 不是 AI 时代才发力的玩家。它是 AI 时代被默默挑选出来的平台。它没有 OpenAI 那样的明星模型,也没有 DeepMind 那样的研究光环,但它有别人都没有的东西:所有人都需要的 GPU 和带宽。
二、Alexa 与早期机器学习的尝试
亚马逊真正进入"消费级 AI"是从 2014 年开始的。那一年 11 月,第一代 Echo 智能音箱在亚马逊会员中悄悄发售;它内置的语音助手叫 Alexa——以亚历山大图书馆为名。Echo + Alexa 让"对着空气说话让机器干活"第一次从科幻变成日常用品。到 2016 年前后,Alexa 几乎是消费级 AI 的代名词,谷歌 Assistant、苹果 Siri、微软 Cortana 都被它压一头。
工程师贡献给云的那一面,是 2015 年发布的 Amazon Machine Learning(一个面向开发者的托管 ML 服务),以及 2017 年 11 月在 re:Invent 大会上推出的 Amazon SageMaker——一站式机器学习平台,从数据标注、特征工程、模型训练、部署、监控全部托管。SageMaker 在 2018 至 2022 年间是企业 ML 工作流最主流的选择之一,也奠定了 AWS"做基础设施而不是做模型"的路径依赖。
但 Alexa 自己并没能跨过深度学习的下一道坎。她的对话仍然停留在指令式问答,没能升级为真正的对话智能体。等到 2022 年 ChatGPT 出现,Alexa 一夜之间显得过时;亚马逊开始把巨额投入转向"如何让 Alexa 接上大模型",但这是后话。
三、与 OpenAI 失之交臂
很少有人提起的一段公案:2015 年 OpenAI 创立之初,AWS 是它早期的算力来源之一。当时几位创始人——奥尔特曼、布朗前后期的伙伴们、苏茨克维——还没有形成与某一家云厂商的独家绑定。AWS 提供过一定额度的算力赞助。
转折发生在 2019 年。微软宣布向 OpenAI 投资 10 亿美元,并把 OpenAI 的训练算力独家迁到 Azure 上。从那一刻起,AWS 失去了进入 OpenAI 生态的机会,被迫以"被替代者"的身份退出最重要的 AI 玩家之一的供应链。这是 AWS 后来全力拥抱 Anthropic 的伏笔——它不能让同样的事情再发生一次。
四、Bedrock:模型超市的诞生
2023 年 4 月 13 日,AWS 宣布推出 Amazon Bedrock,并在当年 9 月 28 日全面可用。Bedrock 的产品定位非常清楚:不做单一旗舰大模型,做模型聚合的托管 API 平台。第一批上线的模型供应方包括 Anthropic(Claude)、AI21 Labs(Jurassic)、Stability AI(Stable Diffusion)、Cohere、亚马逊自家的 Titan,随后接入 Meta 的 Llama 2 / Llama 3、Mistral、Mixtral 等。
如果说微软的策略是"独家娶 OpenAI",谷歌的策略是"全力打 Gemini",那 AWS 的策略就是——做一个永远中立的模型超市。客户在 Bedrock 上一行 API 切换底层模型,不必自己运维 GPU 集群;亚马逊则赚下这张账单中的算力分成。
Bedrock 的另一面,是它把 AWS 已有的企业级合规体系(KMS 加密、VPC 网络隔离、IAM 权限、PrivateLink)全部接进了大模型。对银行、医院、政府、跨国制造业这些 OpenAI Web 直连不能进的客户来说,Bedrock 是它们第一次能"合规地"使用顶级大模型。
五、80 亿美元押注 Anthropic
AWS 的最大手笔出现在 2023 年 9 月 25 日。当天双方共同宣布:亚马逊将向 Anthropic 投资最多 40 亿美元,作为交换,Anthropic 将 AWS 作为其主要云供应方,把 Claude 系列模型部分训练和大规模推理迁移到 AWS 的 Trainium / Inferentia 自研芯片集群上。
2024 年 3 月,这笔投资全部到账。同年 11 月 22 日,AWS 又宣布追加 40 亿美元,把对 Anthropic 的累计投资抬高到 80 亿美元。再加上谷歌的 20 亿美元,Anthropic 在两年里从一家三十多人的研究公司变成估值过 600 亿美元的巨头,背后是 AWS 与谷歌的资本战。
AWS 的算盘很直接:以资本换"模型独家上 Bedrock"的权利,以及把 Claude 训练绑到自研芯片上以推动 Trainium 落地。阿莫代与 AWS CEO 布朗的合作伙伴 Andy Jassy 走得很近,Anthropic 也乐意获得一个不需要担心"被收购"的金主——AWS 始终强调自己只做投资人,不要董事席位,不主导战略方向。这是 AWS 从微软-OpenAI 的紧密绑定中学到的教训。
六、Trainium 与 Inferentia:自研芯片的长线棋
光有钱还不够。2018 年 AWS 推出第一代自研推理芯片 Inferentia;2020 年 12 月发布 Trainium(训练芯片),随后是 2023 年的 Trainium2、2024 年的 Trainium3 路线图。这条产品线由 Annapurna Labs 团队主导——AWS 2015 年收购的以色列芯片公司,是云厂商自研芯片浪潮的开端。
战略意图直白:降低对英伟达 GPU 的依赖。2024 年 H100 一卡难求、英伟达毛利率超过 70% 的格局下,云厂商如果不能自研芯片,就等于把利润全部交给老黄。黄仁勋和 AWS 的关系一直是"既合作又防备"——AWS 既是英伟达最大客户之一,也是英伟达最强的潜在替代者。
Anthropic 的 Claude 部分训练落到 Trainium2 集群上,是这条战略最关键的一次落地。从 2024 年下半年开始,AWS 公开宣布将与 Anthropic 共建 Project Rainier——一个由数十万颗 Trainium2 芯片组成的超算集群,专门服务 Claude 训练。如果 Project Rainier 成功,AWS 就能在最关键的"前沿模型训练算力"这一战中,建立起独立于英伟达的备选供应链。
七、Q、Nova、Agent:把模型嵌进企业工作流
2023 年 11 月 re:Invent 大会,AWS 推出 Amazon Q——面向企业开发者和业务用户的 AI 助手,覆盖代码(Q Developer,原 CodeWhisperer)、商业智能(Q Business)、客服(Q in Connect)。Q 的定位与微软 Copilot 相似,但走的是 B 端深度合规路线。
2024 年 12 月 re:Invent,AWS 又发布自研基础模型家族 Amazon Nova:Micro、Lite、Pro、Premier 四个尺寸的语言模型,外加 Nova Canvas(图像)、Nova Reel(视频)。Nova 不是冲着 SOTA 去的——它的目标是为成本敏感的企业客户提供一个"够用就好、价格便宜、合规无忧"的兜底选项。
同期推出的 Bedrock Agents 与 Bedrock Knowledge Bases 把大模型能力打包成"开箱即用的 RAG + 工具调用",让企业客户不再需要自己拼装 LangChain、向量库、检索逻辑。这一系列产品共同构成了 AWS 在大模型时代的产品矩阵:上层是 Q 与 Bedrock Agents,中层是 Bedrock 模型市场,底层是 Trainium / Inferentia + EC2 GPU。
八、Andy Jassy 时代的策略
2021 年 7 月,杰夫·贝索斯(Jeff Bezos)卸任亚马逊 CEO,由 AWS 创始人 Andy Jassy 接任。Jassy 是 AWS 从 2003 年那个"小灵感"长成全球云霸主的总操盘手,他对云生意的理解极为深刻:这是一门长期的、靠规模与多样性取胜的生意,不需要做明星产品,需要做无聊但不可替代的基础设施。
这一思路体现在 AWS 对 AI 的态度上——不与 OpenAI、Google、Anthropic 在前沿模型上正面竞争,专心做"所有人都跑在我上面"的底座。截至 2026 年,AWS 在全球云市场份额仍居首位(约 30%);Bedrock 已成为 OpenAI API 之外企业大模型 API 的最主要替代选择;Anthropic 依靠 AWS 的算力快速成长为 OpenAI 最有力的挑战者。
如果说微软-OpenAI 是 AI 时代的"魏",谷歌-DeepMind 是"蜀",那 AWS-Anthropic 就是"吴"——三足鼎立的第三极,在闭源派系中走出了一条"中立平台 + 资本伙伴"的路。这条路是否最终胜出还未可知,但 AWS 确实已经把自己稳稳地嵌进了未来十年大模型基础设施的底层。
太史公曰
AWS 是 AI 时代最不像 AI 公司的 AI 巨头。它没有写出过 Transformer,没有训练过 GPT,甚至没有一款让普通人记得住名字的模型。但每一个明星 AI 产品的背后,都或多或少要烧 AWS 的电、用 AWS 的盘、租 AWS 的卡。这是它的卑微,也是它的霸气——在风口最猛的地方做风。八十亿美元押注 Anthropic 不是赌博,而是 AWS 对自己定位的最大一次确认:它不是要赢得明星模型,而是要保证下一代明星模型必须长在它身上。这是一家真正读懂"基础设施是权力"这件事的公司。
亲历者说
征集中
如果你曾在 AWS AI、SageMaker、Bedrock 或 Annapurna Labs 团队工作,欢迎提交贡献。
参考资料
- Amazon Web Services. (2023, April 13). "Announcing New Tools for Building with Generative AI on AWS." AWS Blog.
- Amazon Web Services. (2023, September 28). "Amazon Bedrock Is Now Generally Available." AWS News Blog.
- Anthropic & Amazon. (2023, September 25). "Expanding Access to Safer AI with Amazon." Anthropic Blog.
- Anthropic & Amazon. (2024, November 22). "Anthropic and AWS Deepen Strategic Collaboration." Anthropic Blog.
- Amazon Web Services. (2024, December 3). "Introducing Amazon Nova Foundation Models." re:Invent 2024 Announcement.
- Amazon Web Services. (2017, November 29). "Amazon SageMaker." re:Invent 2017 Keynote.
- Stone, B. (2021). Amazon Unbound: Jeff Bezos and the Invention of a Global Empire. Simon & Schuster.
- The Information. (2024). "Inside Amazon's $8 Billion Bet on Anthropic." (Multiple reports.)
- Vogels, W. (2006). "A Word from the CTO on the Launch of Amazon S3." All Things Distributed Blog.
- AWS re:Invent Keynote Archive (2014–2024).
- SemiAnalysis. (2024). "Trainium2 and AWS's Custom Silicon Strategy."
