一點靈犀/Meta大模型表現不佳 無奈出租算力\李靈修
本周有關「Meta出租閒置算力」的傳聞,被解讀為AI產能過剩的證據,重創全球資本市場。但在筆者看來,算力出租是模型競賽淘汰者的必選動作,Meta只不過認清現實、實事求是。這也是AI行業分化的典型表現:強者加大投入,弱者省吃儉用。
據外媒報道,Meta正籌劃推出雲服務板塊,對外出售AI算力與大模型調用接口。由於此類業務與亞馬遜雲服務(AWS)及CoreWeave算力直銷高度相似,造成後者股價出現大跌。
加大研發開支 成效卻欠佳
業界對此感到震驚的原因在於,Meta年初以來還在算力基建上積極投入。其先是向CoreWeave豪擲超過210億美元簽下六年長期合同,後與Nebius Group達成270億美元的算力採購協議。
4月底的一季度財報會上,Meta更高調宣布,2026年資本支出預期上限將從1350億美元提升至1450億美元。
與之相對的是,Meta自家大模型的進展差強人意。去年4月發布的Llama 4系列,聲稱在多模態、推理、編碼等領域領跑全行業。然而,在第三方測評平台上的表現不佳,不僅落後於DeepSeek等中國大模型,甚至在穩定性上還不如上一代的Llama 3。
今年4月,Meta首次採取了「雙軌制」戰略,分別推出了開源模型Llama 5與閉源模型Muse Spark。分析人士普遍認為,Meta新增商業化程度更高的閉源模型,就是為了給算力消耗「回血」。
研發瓶頸也導致了Meta技術團隊的紛爭,決策層不得不連續調整管理架構,間接拖慢了大模型的交付。特別是在收購Scale AI之後,朱克伯格任命了年僅28歲的亞裔Alexander Wang(中文名汪滔)為公司首席AI官,後者逼走了楊立昆(Yann LeCun)等一批元老,宮鬥慘烈可見一斑。
大模型競賽恐已出局
到了5月份,朱克伯格在股東電話會議上曾表示,「幾乎每周都有外部公司前來聯繫,希望我們推出API服務,或詢問能否購買我們的算力。」此番表態其實已為算力出租埋下伏筆。對朱克伯格來說,大模型研發的燒錢節奏難以應付,當務之急是將沉沒的資本開支轉化為現金流。
須指出的是,大模型在預訓練和推理環節的算力消耗是天差地別的。在預訓練階段,幾萬張頂級GPU需要滿負荷運轉,但訓練完成之後,GPU集群的利用率驟降到30%-50%的水平,就能夠滿足用戶的推理請求。這就好比,特區政府計劃在港島南建設「智慧綠色集體運輸系統」,前期投入的財力、人力規模巨大,但正式運營後每趟班車的資源消耗就微乎其微了。
講白了,朱克伯格判斷自己在大模型競賽中出局了,賣算力是一個不錯的補救方案。
Meta的業務轉型並非孤立。眼見xAI競爭力每況愈下,馬斯克也決定「下水」。(詳見筆者6月6日撰文《馬斯克的「SpaceX故事」能成立嗎?》)就在上個月,Anthropic宣布每月將向SpaceX支付12.5億美元,以租用其位於田納西州孟菲斯附近的數據中心算力資源。谷歌也表示,從今年10月起向SpaceX每月支付9.2億美元,以獲得「約11萬塊英偉達GPU、CPU、內存及其他相關組件」使用權。兩筆訂單將為SpaceX帶來約260億美元的年收入。