馬斯克推出Grok 3 AI競賽白熱化

大公報 A21：國際 2025-02-19

左圖：示威者抗議特朗普政策的集會上高舉抵制馬斯克的海報。\美聯社；右圖：馬斯克（右一）與三位工程師17日在線上舉行Grok 3發布會。\網絡圖片

　　本港時間18日，馬斯克旗下人工智能初創公司xAI通過直播，發布號稱「地球最聰明的AI大模型」Grok 3。演示內容顯示，Grok 3在數學、科學、編程三項能力的相關測評中，得分均高於其他主流AI模型。Grok 3總共用了20萬個英偉達H100GPU訓練，被質疑為「性價比黑洞」。復旦大學計算機科學技術學院教授張奇18日接受大公報專訪時表示，DeepSeek的出現加速了AI領域的競爭，諸如xAI和OpenAI等企業迫於壓力，不得不調整大模型的發布節奏以應對市場變化。\大公報記者蘇雨潤戚佳潔

　　【大公報訊】本港時間18日，馬斯克旗下人工智能（AI）新創公司xAI推出AI模型Grok 3，並十分高調地宣稱，這是「地表最聰明的AI」，目標是為了理解宇宙。根據xAI數據，Grok 3在數學、科學以及編程三大基準測試中的表現還不錯。數據上是超越了所有主流模型，包括GPT-4o、DeepSeek-V3等。以數學測驗為例，Grok 3取得了52分的最高成績，而同屬xAI陣營的Grok 3 mini則拿到40分，DeepSeek-V3以39分緊追在後，GPT-4o只有9分。

　　Grok 3一周後上線語音模式

　　Grok 3性能突破的背後是驚人的資源投入，xAI團隊透露，Grok 3有20萬個英偉達GPU、4億個GPU小時的算力支持。馬斯克在直播中首次披露，Grok 3訓練過程累計消耗20萬個英偉達GPU，訓練在xAI公司的數據中心完成。馬斯克還說，Grok 3將在一周後上線語音模式。

　　據官方數據，Grok 3的運算能力依託由20萬個英偉達H100GPU構建的Colossus超算集群，據稱運算能力是前代產品Grok 2的「10倍以上」，預訓練階段的消耗相當於一座核電站7%的月發電量。以市價計算，一個H100GPU大概在3萬美元（約23.4萬港元），那麼Grok 3的訓練成本就至少在60億美元（約468億港元）左右。相較於DeepSeek以遠低於同行的成本訓練出比肩OpenAI o1模型能力的R1模型，Grok 3的這一算力消耗屬實不小。在馬斯克公布Grok 3訓練成本後，很快便有分析指出，Grok 3的算力消耗是DeepSeek-V3的263倍。

　　DeepSeek走紅加速行業競爭

　　馬斯克宣稱「地球最聰明的AI大模型」。張奇則指出，Grok 3在推理能力上確實更進一步，但就目前數據來看，它依然屬於大體量模型。至於其是否會對DeepSeek的市場造成衝擊，還需取決於它在實際場景中的使用效果。「完整部署Grok 3需要強大的計算量，許多企業出於性價比考量，可能不會選擇它。」

　　隨着Grok 3的發布，AI市場的競爭格局愈發白熱化，各大企業為在這場技術競賽中搶佔優勢，紛紛加大研發投入，加速產品迭代。張奇表示，AI模型間的競爭是行業常態，不過此前相互追趕的速度相對較慢，DeepSeek的走紅讓行業競爭進一步提速。他告訴記者，GPT-4問世後，各大企業在追趕多模態技術方面投入了大量時間與精力，企業間的追趕節奏一度放緩。而DeepSeek的出現將研發工作從「幕後」推向「台前」，研發重點也從「訓練」轉向「推理」，極大縮小技術壁壘，加速了大模型版本的迭代速率。

　　此外，值得注意的是，在本次直播發布會上，馬斯克多次提及DeepSeek。張奇表示，在Grok 1發布時，xAI研發團隊的關注焦點主要集中在OpenAI等頭部企業，幾乎從未提及中國的AI模型。「DeepSeek的異軍突起徹底改變了這一狀況，這反映出馬斯克乃至美國科技界對中國AI企業技術突破與創新能力的高度認可。」

讀大公報PDF版面