馬斯克推出Grok 3 AI競賽白熱化

  左圖:示威者抗議特朗普政策的集會上高舉抵制馬斯克的海報。\美聯社;右圖:馬斯克(右一)與三位工程師17日在線上舉行Grok 3發布會。\網絡圖片
  左圖:示威者抗議特朗普政策的集會上高舉抵制馬斯克的海報。\美聯社;右圖:馬斯克(右一)與三位工程師17日在線上舉行Grok 3發布會。\網絡圖片

  本港時間18日,馬斯克旗下人工智能初創公司xAI通過直播,發布號稱「地球最聰明的AI大模型」Grok 3。演示內容顯示,Grok 3在數學、科學、編程三項能力的相關測評中,得分均高於其他主流AI模型。Grok 3總共用了20萬個英偉達H100GPU訓練,被質疑為「性價比黑洞」。復旦大學計算機科學技術學院教授張奇18日接受大公報專訪時表示,DeepSeek的出現加速了AI領域的競爭,諸如xAI和OpenAI等企業迫於壓力,不得不調整大模型的發布節奏以應對市場變化。\大公報記者蘇雨潤 戚佳潔

  【大公報訊】本港時間18日,馬斯克旗下人工智能(AI)新創公司xAI推出AI模型Grok 3,並十分高調地宣稱,這是「地表最聰明的AI」,目標是為了理解宇宙。根據xAI數據,Grok 3在數學、科學以及編程三大基準測試中的表現還不錯。數據上是超越了所有主流模型,包括GPT-4o、DeepSeek-V3等。以數學測驗為例,Grok 3取得了52分的最高成績,而同屬xAI陣營的Grok 3 mini則拿到40分,DeepSeek-V3以39分緊追在後,GPT-4o只有9分。

  Grok 3一周後上線語音模式

  Grok 3性能突破的背後是驚人的資源投入,xAI團隊透露,Grok 3有20萬個英偉達GPU、4億個GPU小時的算力支持。馬斯克在直播中首次披露,Grok 3訓練過程累計消耗20萬個英偉達GPU,訓練在xAI公司的數據中心完成。馬斯克還說,Grok 3將在一周後上線語音模式。

  據官方數據,Grok 3的運算能力依託由20萬個英偉達H100GPU構建的Colossus超算集群,據稱運算能力是前代產品Grok 2的「10倍以上」,預訓練階段的消耗相當於一座核電站7%的月發電量。以市價計算,一個H100GPU大概在3萬美元(約23.4萬港元),那麼Grok 3的訓練成本就至少在60億美元(約468億港元)左右。相較於DeepSeek以遠低於同行的成本訓練出比肩OpenAI o1模型能力的R1模型,Grok 3的這一算力消耗屬實不小。在馬斯克公布Grok 3訓練成本後,很快便有分析指出,Grok 3的算力消耗是DeepSeek-V3的263倍。

  DeepSeek走紅加速行業競爭

  馬斯克宣稱「地球最聰明的AI大模型」。張奇則指出,Grok 3在推理能力上確實更進一步,但就目前數據來看,它依然屬於大體量模型。至於其是否會對DeepSeek的市場造成衝擊,還需取決於它在實際場景中的使用效果。「完整部署Grok 3需要強大的計算量,許多企業出於性價比考量,可能不會選擇它。」

  隨着Grok 3的發布,AI市場的競爭格局愈發白熱化,各大企業為在這場技術競賽中搶佔優勢,紛紛加大研發投入,加速產品迭代。張奇表示,AI模型間的競爭是行業常態,不過此前相互追趕的速度相對較慢,DeepSeek的走紅讓行業競爭進一步提速。他告訴記者,GPT-4問世後,各大企業在追趕多模態技術方面投入了大量時間與精力,企業間的追趕節奏一度放緩。而DeepSeek的出現將研發工作從「幕後」推向「台前」,研發重點也從「訓練」轉向「推理」,極大縮小技術壁壘,加速了大模型版本的迭代速率。

  此外,值得注意的是,在本次直播發布會上,馬斯克多次提及DeepSeek。張奇表示,在Grok 1發布時,xAI研發團隊的關注焦點主要集中在OpenAI等頭部企業,幾乎從未提及中國的AI模型。「DeepSeek的異軍突起徹底改變了這一狀況,這反映出馬斯克乃至美國科技界對中國AI企業技術突破與創新能力的高度認可。」