扎克伯格刚刚承认,Meta的AI agent进展比预期慢了。

据路透社报道,他在Meta内部全员会上表示,过去4个月,AI agent技术的发展“没有像我们预期的那样加速”,公司年初围绕AI推进的组织重构,也“还没有兑现”预期。但另一边,Meta今年的资本支出最高可能达到1450亿美元,其中很大部分指向AI基础设施和数据中心扩张。

钱已经砸下去,产品回报还在路上。

几乎同一时间,彭博社称,Meta正在筹备一项云业务,计划出租多余AI算力。这让Meta站到了一个微妙的位置上:它曾是硅谷最激进的算力囤积者之一,且这种算力囤积是为自家激进的AI研发计划服务的,如今却开始考虑把自家的AI基础设施拿出去变现。

这条路,马斯克已经先走一步。SpaceX把Colossus算力租给Anthropic,又和谷歌签下多年云服务协议。现在,小扎像是在摸着马斯克过河。

AI算力竞争正在出现一个新转向。过去比的是谁能抢到更多GPU,现在要回答的是抢到之后,谁能把这些GPU用满、租出去、变成收入。

小扎摸着马斯克过河?

Meta要卖算力的消息,是在当地时间7月1日传出来的。

彭博社称,Meta正在筹备一项云业务,计划出售多余的AI计算能力。

按照报道,这项计划还在开发中,策略仍可能变化,Meta也拒绝置评。但大致方向已经很清楚:Meta可能让开发者访问托管在其基础设施上的AI模型,比如Muse Spark,并按照运行这些模型所需的算力收费。与此同时,它也在考虑像CoreWeave、Nebius这类neocloud一样,直接出租原始AI算力。

这不是一个小动作。过去很长时间里,Meta并不是一家云服务商。它的基本盘是社交平台和广告业务,AI基础设施更多是为内部模型、推荐系统、广告系统和产品功能服务。

外界立刻开始猜测——这是否意味着Meta已经准备好将重心从自研/全栈AI上移开?Meta是不是正在给巨额AI投入寻找一条更现实的回本路径?

这种猜测并非毫无根据。Meta这几年在AI上投入很重,但前沿模型叙事并不算顺利。它4月发布了Muse Spark,这是Meta新组建的高成本AI团队推出的首个模型,但其主打轻快,更核心的“旗舰大模型”迟迟未现身。

问题在于,钱已经先花出去了。Meta在一季度财报中把2026年资本开支预期提高到1250亿至1450亿美元,高于此前1150亿至1350亿美元的区间,理由包括组件价格上涨,以及为未来算力容量增加数据中心成本。

当AI基础设施支出膨胀到千亿美元级别,投资者自然会关心这些GPU、数据中心和电力什么时候能变成收入。

所以,市场对“Meta要出租算力”的反应很直接。报道传出后,Meta股价涨超10%,这缓解了它此前跑输标普500指数的压力。与此同时,CoreWeave和Nebius分别下跌10.8%和12.4%。

Meta要卖算力,最直接的好处就是“回血”。

这条路,马斯克已经先走一步。

今年5月,SpaceX就把旗下孟菲斯数据中心Colossus的算力租给了Anthropic。Anthropic当时表示,它将使用SpaceXColossus1设施的全部算力。这个设施拥有超过22万颗英伟达处理器,并将在一个月内为Anthropic带来300兆瓦新增容量。

随后,SpaceX又和谷歌签下多年云服务协议。按照文件,谷歌将从2026年10月到2029年6月,每月向SpaceX支付9.2亿美元,换取约11万颗英伟达GPU以及CPU、内存等相关组件提供的计算能力。

路透计算称,SpaceX与Anthropic、谷歌这两份算力访问协议,按年计算合计约260亿美元;如果两份合同都不提前终止,总规模超过700亿美元。

马斯克本来也是AI算力军备竞赛里最激进的玩家之一。Colossus原本服务于xAI和Grok的叙事,是马斯克追赶OpenAI、Anthropic的重要基础设施。但在自己的AI业务还没有完全消化这些算力之前,SpaceX先把算力租给了更缺算力、更能立刻消化算力的Anthropic和谷歌。

更关键的是,马斯克强调这种合作的短期性和灵活性。

关于Anthropic租用Colossus的安排,他后来专门澄清,SpaceX先签了180天租约,之后双方都可以提前90天通知取消。他还说,短期安排是SpaceX方面提出的,如果未来算力变得非常紧,SpaceX可能需要把算力拿回来。

这句话说明了出租算力的真正意图:它不等于放弃AI自研,也不等于承认自家AI业务没戏。公司选择在内部需求和外部变现之间保留弹性。算力可以先租给更饥渴的客户,换取现金流;等自己的模型、产品和用户需求追上来,再把算力拿回来。

放到Meta身上,也是同样的道理。它并不需要宣布自己转型云厂商,也不需要承认AI自研路线受挫。只要把一部分多余或暂时没有被内部完全消化的算力拿出来,就能同时讲两个故事:对内,AI基础设施仍然是未来战略;对外,这些基础设施已经可以开始产生收入。

于是,AI算力竞争出现了一个微妙转向。

过去几年,硅谷巨头争相竞争谁能更快抢到GPU、建起更大的数据中心。现在,问题开始变成抢到之后,谁能把这些GPU用满。而这种“用满”,可以是自己用,也可以是别家用。

算力冗余与短缺的两重天

但Meta和SpaceX开始出租算力,并不意味着整个AI行业都已经进入算力过剩。

恰恰相反,几乎在同一时期,算力短缺仍然是AI新闻中最常出现的关键词。

Anthropic今年5月宣布完成650亿美元H轮融资时称,公司投后估值达到9650亿美元,年化收入在5月初已经超过470亿美元。Anthropic说,这笔融资将用于扩大算力,以满足Claude不断增长的需求。

路透也在报道中提到,Anthropic过去几个月一度难以满足需求,不得不在高峰时段设置使用限制,并通过鼓励用户在非高峰时段使用来调节算力压力。

Anthropic随后公布的算力合作,更能说明这个问题。除了SpaceX,Anthropic还列出了其他几项算力安排:与Amazon最高5吉瓦的协议,其中包括2026年底前近1吉瓦的新容量;与谷歌和Broadcom的5吉瓦协议;与微软和英伟达的300亿美元Azure容量合作;以及和Fluidstack在美国AI基础设施上的500亿美元投资。

对Anthropic来说,更多算力意味着更高的Claude Code使用上限、更大的API调用容量,以及更多企业客户能被接进来。

OpenAI也是类似情况。4月29日,OpenAI在介绍Stargate进展时说,为了满足消费者、企业、开发者和政府对AI日益增长的需求,公司正在继续扩大算力版图,把新容量更快投入使用。OpenAI还提到,2025年1月宣布“星门Stargate”时,曾承诺到2029年在美国确保10吉瓦AI基础设施;一年多后,这一目标已经提前超过,其中过去90天就新增超过3吉瓦。

所以,不能简单说AI算力泡沫已经破了。更准确的说法是,算力开始出现错位。

一边是Anthropic、OpenAI这类公司。它们已经有明确的产品入口、开发者生态和企业客户,用户需求直接转化成token调用、订阅收入和API账单。

对它们来说,算力越多,能承接的需求就越多,收入天花板也越高。

另一边,则是Meta和xAI/SpaceX这类玩家。它们同样是AI算力军备竞赛中最激进的囤积者,但自己的AI产品和商业闭环还没有被同等程度地验证。

Meta有Meta AI、AI眼镜、Instagram和WhatsApp里的AI功能,也有Muse Spark这样的新模型。xAI有Grok和马斯克生态。但相比Anthropic靠Claude Code、API和企业客户跑出来的增长,Meta和xAI的AI投入,还没有形成同样清晰的收入闭环。

在当下,最需要算力的人,未必就是最早、最激进囤算力的人。

算力短缺和算力冗余正在同时发生。真正能把算力变成收入的公司仍然缺算力,而那些先把算力建起来、但内部产品需求尚未完全释放的公司,则开始把算力当成一种可以出租、交易与回收现金流的资产。

AI算力竞争正在从“囤积阶段”进入“变现阶段”。

算力流通的新格局

算力开始流通之后,AI基础设施市场的玩家位置也在重新排列。

最早,也最自然吃到这波需求的,还是传统云厂商。微软、谷歌和亚马逊AWS本来就是云服务商,出租计算资源是它们的主业。只是到了AI时代,云服务的核心资源正在从CPU、存储和数据库,转向GPU、TPU、模型调用和AI开发平台。

谷歌就是一个典型例子。Alphabet一季度财报电话会上,皮查伊说,谷歌云一季度收入同比增长63%,首次超过200亿美元;未履约订单,也就是已经签约但尚未确认收入的合同金额,环比接近翻倍,超过4600亿美元。谷歌云的增长,来自企业AI产品和AI基础设施需求。

谷歌还说,其第一方模型通过客户直接API调用处理的token数量,从上一季度的每分钟100亿个,增长到每分钟160亿个以上。与此同时,谷歌继续把自研TPU、Axion CPU和英伟达GPU一起打包进云服务,并在Cloud Next上推出第八代TPU。

微软也不是突然开始卖AI算力。Azure本来就是全球最大的云平台之一,只是AI让它的增长和成本结构都发生了变化。

微软2026财年三季度财报电话会显示,微软云收入达到545亿美元,同比增长29%;Azure和其他云服务收入增长40%。但微软同时强调,客户需求仍然超过可用容量。也就是说,对微软来说,算力还不够用。

不过,AI算力也在改变微软的商业模式。微软称,公司毛利率同比下降,原因包括持续投资AI基础设施,以及AI产品使用量增长。GitHub Copilot就是一个例子。微软说,GitHub Copilot已经有近14万家组织使用,企业订阅用户同比接近增长两倍;但它也宣布从6月1日起,将GitHub Copilot转向更符合实际使用量和成本的定价模式。

这说明,传统云厂商和Meta、SpaceX面临的问题并不一样。微软和谷歌本来就有云平台、企业客户、销售体系和计费系统,AI算力可以自然装进既有业务里。它们要解决的是,如何让昂贵的GPU、TPU和数据中心投入,继续转化成高质量收入。

当Meta、SpaceX这样的大玩家的算力从内部战略资源,变成了市场上的供给,原有的云厂商——尤其是中小云厂商——的生意势必会受到影响。

被直接挤到的,是CoreWeave、Nebius这类neocloud。所谓neocloud,本质上就是一批围绕AI算力缺口长出来的新型云服务商。它们从英伟达那里拿GPU,建设专门服务AI训练和推理的数据中心,再把算力租给OpenAI、微软、Meta、xAI、Anthropic这类客户。

过去两年,AI公司缺算力,传统云厂商也排队扩建,neocloud因此有了很大的生存空间。

但Meta考虑出租算力的消息一出来,市场立刻意识到,这个空间可能被重新挤压。MarketWatch报道称,Meta目前和CoreWeave有352亿美元基础设施合同;如果Meta自己建设“Meta Compute”部门,既向开发者提供托管模型,也直接出租原始算力,就会和现有neocloud形成直接竞争。

这就是CoreWeave、Nebius股价下跌的原因。对neocloud来说,它们原本扮演的是中间商:从芯片公司和资本市场那里拿资源,再把算力卖给AI公司。如今可能遭到两头挤压,一头是谷歌、微软、AWS这些老牌云厂商,另一头是原本只自用、现在也开始对外出租算力的非云巨头。

英伟达则站在更上游的位置。它不只是卖芯片,也在想办法让这些芯片进入更顺畅的流通体系。

去年5月,英伟达就推出过Lepton平台,试图建立一个AI算力市场。路透当时报道,Lepton可以让云计算公司在一个平台上出售GPU容量,CoreWeave、Nebius、Crusoe、Firmus、Foxconn、GMI Cloud、Lambda、Nscale、SoftBank和Yotta等公司都加入了这一平台。英伟达云业务副总裁Alexis Bjorlin当时说,开发者寻找可用算力的过程仍然非常手工化,“几乎像所有人都在给所有人打电话,问哪里还有算力”。

今年7月,英伟达又把这件事往前推进了一步。

英伟达官方博客称,公司正在和AI云厂商合作部署大规模、多租户的AI工厂,并通过收入分成和信用支持模式对齐经济利益。按照这套模式,AI云厂商出售基于英伟达的云服务,英伟达除了获得标准产品收入,还可以从受支持算力的云收入中分成。首批合作方包括Sharon AI和Firmus,前者计划部署最多4万颗Grace Blackwell GB300 GPU,后者在印度尼西亚Batam建设的DSX AI工厂园区预计规模最高可达360兆瓦、17万颗英伟达GPU。

这已经不只是卖芯片了。英伟达开始像整个GPU云市场的组织者和兜底者。它要帮助新云厂商拿到资本、建起AI工厂、把GPU租出去,再从它们的云收入里继续分一杯羹。

路透去年还报道过,CoreWeave和英伟达签下63亿美元订单,协议保证英伟达会购买CoreWeave未售出的云计算容量,直到2032年4月13日。 这类安排说明,GPU不再只是硬件,而是可以被融资、租赁、保底、收入分成和重新分配的资产。

到这里,算力市场的新格局就清楚了。谷歌、微软、AWS这样的传统云厂商,继续把AI算力整合进原有的云业务里;Meta、SpaceX这样的非云巨头,开始把内部AI基础设施拿出来出租;CoreWeave、Nebius这样的neocloud,既吃到AI算力短缺的红利,也要面对巨头亲自下场的压力;英伟达则从卖铲子的人,变成算力流通体系里的组织者、撮合者和风险兜底方。

这不是一个简单的“算力过剩”或“算力短缺”的故事。更准确地说,AI算力正在从战略储备变成可交易资产。

接下来,谁能把算力变成真正的收入,谁才算穿越AI军备竞赛的下半场。

【字母AI】原文 -- 讲述值得讲述的真实故事,直面生活、命运和内心