扎男服输，AI大厂开始“分流”

扎克伯格刚刚承认，Meta的AI agent进展比预期慢了。

据路透社报道，他在Meta内部全员会上表示，过去4个月，AI agent技术的发展“没有像我们预期的那样加速”，公司年初围绕AI推进的组织重构，也“还没有兑现”预期。但另一边，Meta今年的资本支出最高可能达到1450亿美元，其中很大部分指向AI基础设施和数据中心扩张。

钱已经砸下去，产品回报还在路上。

几乎同一时间，彭博社称，Meta正在筹备一项云业务，计划出租多余AI算力。这让Meta站到了一个微妙的位置上：它曾是硅谷最激进的算力囤积者之一，且这种算力囤积是为自家激进的AI研发计划服务的，如今却开始考虑把自家的AI基础设施拿出去变现。

这条路，马斯克已经先走一步。SpaceX把Colossus算力租给Anthropic，又和谷歌签下多年云服务协议。现在，小扎像是在摸着马斯克过河。

AI算力竞争正在出现一个新转向。过去比的是谁能抢到更多GPU，现在要回答的是抢到之后，谁能把这些GPU用满、租出去、变成收入。

小扎摸着马斯克过河？

Meta要卖算力的消息，是在当地时间7月1日传出来的。

彭博社称，Meta正在筹备一项云业务，计划出售多余的AI计算能力。

按照报道，这项计划还在开发中，策略仍可能变化，Meta也拒绝置评。但大致方向已经很清楚：Meta可能让开发者访问托管在其基础设施上的AI模型，比如Muse Spark，并按照运行这些模型所需的算力收费。与此同时，它也在考虑像CoreWeave、Nebius这类neocloud一样，直接出租原始AI算力。

这不是一个小动作。过去很长时间里，Meta并不是一家云服务商。它的基本盘是社交平台和广告业务，AI基础设施更多是为内部模型、推荐系统、广告系统和产品功能服务。

外界立刻开始猜测——这是否意味着Meta已经准备好将重心从自研/全栈AI上移开？Meta是不是正在给巨额AI投入寻找一条更现实的回本路径？

这种猜测并非毫无根据。Meta这几年在AI上投入很重，但前沿模型叙事并不算顺利。它4月发布了Muse Spark，这是Meta新组建的高成本AI团队推出的首个模型，但其主打轻快，更核心的“旗舰大模型”迟迟未现身。

问题在于，钱已经先花出去了。Meta在一季度财报中把2026年资本开支预期提高到1250亿至1450亿美元，高于此前1150亿至1350亿美元的区间，理由包括组件价格上涨，以及为未来算力容量增加数据中心成本。

当AI基础设施支出膨胀到千亿美元级别，投资者自然会关心这些GPU、数据中心和电力什么时候能变成收入。

所以，市场对“Meta要出租算力”的反应很直接。报道传出后，Meta股价涨超10%，这缓解了它此前跑输标普500指数的压力。与此同时，CoreWeave和Nebius分别下跌10.8%和12.4%。

Meta要卖算力，最直接的好处就是“回血”。

这条路，马斯克已经先走一步。

今年5月，SpaceX就把旗下孟菲斯数据中心Colossus的算力租给了Anthropic。Anthropic当时表示，它将使用SpaceXColossus1设施的全部算力。这个设施拥有超过22万颗英伟达处理器，并将在一个月内为Anthropic带来300兆瓦新增容量。

随后，SpaceX又和谷歌签下多年云服务协议。按照文件，谷歌将从2026年10月到2029年6月，每月向SpaceX支付9.2亿美元，换取约11万颗英伟达GPU以及CPU、内存等相关组件提供的计算能力。

路透计算称，SpaceX与Anthropic、谷歌这两份算力访问协议，按年计算合计约260亿美元；如果两份合同都不提前终止，总规模超过700亿美元。

马斯克本来也是AI算力军备竞赛里最激进的玩家之一。Colossus原本服务于xAI和Grok的叙事，是马斯克追赶OpenAI、Anthropic的重要基础设施。但在自己的AI业务还没有完全消化这些算力之前，SpaceX先把算力租给了更缺算力、更能立刻消化算力的Anthropic和谷歌。

更关键的是，马斯克强调这种合作的短期性和灵活性。

关于Anthropic租用Colossus的安排，他后来专门澄清，SpaceX先签了180天租约，之后双方都可以提前90天通知取消。他还说，短期安排是SpaceX方面提出的，如果未来算力变得非常紧，SpaceX可能需要把算力拿回来。

这句话说明了出租算力的真正意图：它不等于放弃AI自研，也不等于承认自家AI业务没戏。公司选择在内部需求和外部变现之间保留弹性。算力可以先租给更饥渴的客户，换取现金流；等自己的模型、产品和用户需求追上来，再把算力拿回来。

放到Meta身上，也是同样的道理。它并不需要宣布自己转型云厂商，也不需要承认AI自研路线受挫。只要把一部分多余或暂时没有被内部完全消化的算力拿出来，就能同时讲两个故事：对内，AI基础设施仍然是未来战略；对外，这些基础设施已经可以开始产生收入。

于是，AI算力竞争出现了一个微妙转向。

过去几年，硅谷巨头争相竞争谁能更快抢到GPU、建起更大的数据中心。现在，问题开始变成抢到之后，谁能把这些GPU用满。而这种“用满”，可以是自己用，也可以是别家用。

算力冗余与短缺的两重天

但Meta和SpaceX开始出租算力，并不意味着整个AI行业都已经进入算力过剩。

恰恰相反，几乎在同一时期，算力短缺仍然是AI新闻中最常出现的关键词。

Anthropic今年5月宣布完成650亿美元H轮融资时称，公司投后估值达到9650亿美元，年化收入在5月初已经超过470亿美元。Anthropic说，这笔融资将用于扩大算力，以满足Claude不断增长的需求。

路透也在报道中提到，Anthropic过去几个月一度难以满足需求，不得不在高峰时段设置使用限制，并通过鼓励用户在非高峰时段使用来调节算力压力。

Anthropic随后公布的算力合作，更能说明这个问题。除了SpaceX，Anthropic还列出了其他几项算力安排：与Amazon最高5吉瓦的协议，其中包括2026年底前近1吉瓦的新容量；与谷歌和Broadcom的5吉瓦协议；与微软和英伟达的300亿美元Azure容量合作；以及和Fluidstack在美国AI基础设施上的500亿美元投资。

对Anthropic来说，更多算力意味着更高的Claude Code使用上限、更大的API调用容量，以及更多企业客户能被接进来。

OpenAI也是类似情况。4月29日，OpenAI在介绍Stargate进展时说，为了满足消费者、企业、开发者和政府对AI日益增长的需求，公司正在继续扩大算力版图，把新容量更快投入使用。OpenAI还提到，2025年1月宣布“星门Stargate”时，曾承诺到2029年在美国确保10吉瓦AI基础设施；一年多后，这一目标已经提前超过，其中过去90天就新增超过3吉瓦。

所以，不能简单说AI算力泡沫已经破了。更准确的说法是，算力开始出现错位。

一边是Anthropic、OpenAI这类公司。它们已经有明确的产品入口、开发者生态和企业客户，用户需求直接转化成token调用、订阅收入和API账单。

对它们来说，算力越多，能承接的需求就越多，收入天花板也越高。

另一边，则是Meta和xAI/SpaceX这类玩家。它们同样是AI算力军备竞赛中最激进的囤积者，但自己的AI产品和商业闭环还没有被同等程度地验证。

Meta有Meta AI、AI眼镜、Instagram和WhatsApp里的AI功能，也有Muse Spark这样的新模型。xAI有Grok和马斯克生态。但相比Anthropic靠Claude Code、API和企业客户跑出来的增长，Meta和xAI的AI投入，还没有形成同样清晰的收入闭环。

在当下，最需要算力的人，未必就是最早、最激进囤算力的人。

算力短缺和算力冗余正在同时发生。真正能把算力变成收入的公司仍然缺算力，而那些先把算力建起来、但内部产品需求尚未完全释放的公司，则开始把算力当成一种可以出租、交易与回收现金流的资产。

AI算力竞争正在从“囤积阶段”进入“变现阶段”。

算力流通的新格局

算力开始流通之后，AI基础设施市场的玩家位置也在重新排列。

最早，也最自然吃到这波需求的，还是传统云厂商。微软、谷歌和亚马逊AWS本来就是云服务商，出租计算资源是它们的主业。只是到了AI时代，云服务的核心资源正在从CPU、存储和数据库，转向GPU、TPU、模型调用和AI开发平台。

谷歌就是一个典型例子。Alphabet一季度财报电话会上，皮查伊说，谷歌云一季度收入同比增长63%，首次超过200亿美元；未履约订单，也就是已经签约但尚未确认收入的合同金额，环比接近翻倍，超过4600亿美元。谷歌云的增长，来自企业AI产品和AI基础设施需求。

谷歌还说，其第一方模型通过客户直接API调用处理的token数量，从上一季度的每分钟100亿个，增长到每分钟160亿个以上。与此同时，谷歌继续把自研TPU、Axion CPU和英伟达GPU一起打包进云服务，并在Cloud Next上推出第八代TPU。

微软也不是突然开始卖AI算力。Azure本来就是全球最大的云平台之一，只是AI让它的增长和成本结构都发生了变化。

微软2026财年三季度财报电话会显示，微软云收入达到545亿美元，同比增长29%；Azure和其他云服务收入增长40%。但微软同时强调，客户需求仍然超过可用容量。也就是说，对微软来说，算力还不够用。

不过，AI算力也在改变微软的商业模式。微软称，公司毛利率同比下降，原因包括持续投资AI基础设施，以及AI产品使用量增长。GitHub Copilot就是一个例子。微软说，GitHub Copilot已经有近14万家组织使用，企业订阅用户同比接近增长两倍；但它也宣布从6月1日起，将GitHub Copilot转向更符合实际使用量和成本的定价模式。

这说明，传统云厂商和Meta、SpaceX面临的问题并不一样。微软和谷歌本来就有云平台、企业客户、销售体系和计费系统，AI算力可以自然装进既有业务里。它们要解决的是，如何让昂贵的GPU、TPU和数据中心投入，继续转化成高质量收入。

当Meta、SpaceX这样的大玩家的算力从内部战略资源，变成了市场上的供给，原有的云厂商——尤其是中小云厂商——的生意势必会受到影响。

被直接挤到的，是CoreWeave、Nebius这类neocloud。所谓neocloud，本质上就是一批围绕AI算力缺口长出来的新型云服务商。它们从英伟达那里拿GPU，建设专门服务AI训练和推理的数据中心，再把算力租给OpenAI、微软、Meta、xAI、Anthropic这类客户。

过去两年，AI公司缺算力，传统云厂商也排队扩建，neocloud因此有了很大的生存空间。

但Meta考虑出租算力的消息一出来，市场立刻意识到，这个空间可能被重新挤压。MarketWatch报道称，Meta目前和CoreWeave有352亿美元基础设施合同；如果Meta自己建设“Meta Compute”部门，既向开发者提供托管模型，也直接出租原始算力，就会和现有neocloud形成直接竞争。

这就是CoreWeave、Nebius股价下跌的原因。对neocloud来说，它们原本扮演的是中间商：从芯片公司和资本市场那里拿资源，再把算力卖给AI公司。如今可能遭到两头挤压，一头是谷歌、微软、AWS这些老牌云厂商，另一头是原本只自用、现在也开始对外出租算力的非云巨头。

英伟达则站在更上游的位置。它不只是卖芯片，也在想办法让这些芯片进入更顺畅的流通体系。

去年5月，英伟达就推出过Lepton平台，试图建立一个AI算力市场。路透当时报道，Lepton可以让云计算公司在一个平台上出售GPU容量，CoreWeave、Nebius、Crusoe、Firmus、Foxconn、GMI Cloud、Lambda、Nscale、SoftBank和Yotta等公司都加入了这一平台。英伟达云业务副总裁Alexis Bjorlin当时说，开发者寻找可用算力的过程仍然非常手工化，“几乎像所有人都在给所有人打电话，问哪里还有算力”。

今年7月，英伟达又把这件事往前推进了一步。

英伟达官方博客称，公司正在和AI云厂商合作部署大规模、多租户的AI工厂，并通过收入分成和信用支持模式对齐经济利益。按照这套模式，AI云厂商出售基于英伟达的云服务，英伟达除了获得标准产品收入，还可以从受支持算力的云收入中分成。首批合作方包括Sharon AI和Firmus，前者计划部署最多4万颗Grace Blackwell GB300 GPU，后者在印度尼西亚Batam建设的DSX AI工厂园区预计规模最高可达360兆瓦、17万颗英伟达GPU。

这已经不只是卖芯片了。英伟达开始像整个GPU云市场的组织者和兜底者。它要帮助新云厂商拿到资本、建起AI工厂、把GPU租出去，再从它们的云收入里继续分一杯羹。

路透去年还报道过，CoreWeave和英伟达签下63亿美元订单，协议保证英伟达会购买CoreWeave未售出的云计算容量，直到2032年4月13日。这类安排说明，GPU不再只是硬件，而是可以被融资、租赁、保底、收入分成和重新分配的资产。

到这里，算力市场的新格局就清楚了。谷歌、微软、AWS这样的传统云厂商，继续把AI算力整合进原有的云业务里；Meta、SpaceX这样的非云巨头，开始把内部AI基础设施拿出来出租；CoreWeave、Nebius这样的neocloud，既吃到AI算力短缺的红利，也要面对巨头亲自下场的压力；英伟达则从卖铲子的人，变成算力流通体系里的组织者、撮合者和风险兜底方。

这不是一个简单的“算力过剩”或“算力短缺”的故事。更准确地说，AI算力正在从战略储备变成可交易资产。

接下来，谁能把算力变成真正的收入，谁才算穿越AI军备竞赛的下半场。

【字母AI】原文 -- 讲述值得讲述的真实故事，直面生活、命运和内心