超越博弈思維 把握DeepSeek機遇造福人類
沈 逸 復旦大學網絡空間國際治理研究基地主任
無論是中國創科能力的提升、中美雙邊關係的變化,還是全球多邊治理的探索與創新,DeepSeek取得的成功,都為中國注入更大主動性、建設性和確定性。希望美國方面以及其他全球行為體,能夠採取負責任的行動,抓住這次機遇,為世界發展注入更多建設性因素,造福世界人民。
2025年1月,正值全球華人歡度中國新春佳節,來自長三角的中國人工智能初創企業深度求索(DeepSeek) 成功推出大模型DeepSeek-R1,用更低的成本和更小的算力規模,實現了足以匹敵美國頂尖AI模型的效果。根據深度求索的技術報告,該模型使用由英偉達H800顯卡(一款針對中國市場的低配版GPU,以應對美國對華高端芯片禁令)驅動的數據中心進行訓練。公開消息顯示,深度求索僅用兩個月就完成了訓練,成本為550萬美元,僅為OpenAI等美國公司所花費金額的一小部分。同時,因為該模型在訓練成本控制與推理效能等方面的出色表現,美西方長期以來推崇的「算力至上」敘事,也面臨顯著衝擊,資本市場上英偉達等企業股票的走勢,以更具象化的方式將這種衝擊呈現在全球的觀察者與分析家面前。
美西方「小院高牆」難奏效
儘管切入角度不同,但坊間評論普遍將深度求索的大模型成功發布,關連到中美戰略競爭,作相應解讀。雖然大模型研發並非國家項目,而是私募基金投資者根據市場化原則展開的研究,但所有觀察者都承認,DeepSeek大模型的成功,給美國對中國實施的高科技限制措施,尤其是「小院高牆」名義下限制中國獲取先進製程算力芯片的制裁措施,提出了巨大的質疑和挑戰。
很明顯,正是在美國限制措施的刺激下,中國創新團隊另闢蹊徑,不僅繞開了美國對中國的制裁措施,探索並開拓了用更低成本、更加有限的基礎設施,構建更具效率、更加便宜的AI大模型的道路,而且展現了後續更加完整的非美技術生態,即DeepSeek大模型與華為等企業在非美算力芯片以及數字基礎設施等方面的協同配套,可以更加有效地進行對沖,甚至在相當程度上「中立化」美國對華採取的高科技限制措施。
對於中美關係來說,DeepSeek的成功在很大程度上向美國提供了一個體面的調整台階。美國可以優雅且不失體面地承認,前任政府採取的政策已經成為不應持續加注的錯誤選擇,這與是否向中國政府認輸無關,而是一種基於美國國家利益而作出的務實、理性、有效選擇。
當然,一如人們所熟悉的那樣,美國的真實選擇,尤其是在最近幾年,始終與人們的善良願望存在顯著的偏離,甚至是某種背道而馳。此次面對DeepSeek帶來的AI大模型衝擊與挑戰,也不能例外。美國白宮已經甩出了國家安全威脅的旗幟,宣稱要對DeepSeek進行調查,並將大模型「蒸餾技術」污名化為「知識竊取」;部分與美國人工智能行業金融炒作深度綁定的持份者,試圖以所謂非法獲取受制裁的H100算力芯片等虛假信息,以及堅定否認550萬美元是真實成本等方式,來對沖來自太平洋彼岸的衝擊。
短期乃至中期,這種習慣性的霸權式強硬,難免會對中國創科發展帶來一些麻煩和阻力,但正如本周英偉達股價劇烈波動所傳遞的信息一樣,過度金融化的美式AI發展模式,進一步放大了「算力軍備競賽」所獨有的脆弱性,美國針對中國創科的強硬打壓,最終只會反噬自身,程度或許將比以往更嚴重,時間也會來得更快。
低成本讓世界享受AI紅利
人工智能作為二十一世紀最具革命性的技術之一,正在深刻改變人類社會的方方面面。中美作為全球兩大科技強國,在人工智能領域各有優勢,如果兩國能夠攜手合作,不僅可以加速AI技術的發展,更能為全球人類社會帶來更多福祉。
如果能超越雙邊博弈,站在中國倡導的「人類命運共同體」的視角,DeepSeek實現的低成本高效益AI大模型的突破,具有戰略層級的積極意涵。中國可以將這種產品嵌入「一帶一路」,實現從基礎設施到終端應用的系統性覆蓋,不僅在人工智能革命的背景下,讓參與「一帶一路」的新興市場國家以及全球南方國家,能夠獲得高質量的AI,作為數字時代的公共產品;而且能夠用這種方式,解決以聯合國為代表的國際社會所高度關注的AI革命背景下,如何避免全球範圍數字鴻溝持續擴大的嚴峻挑戰,即避免受成本約束,無法讓世界普遍享受AI大模型帶來的發展紅利,導致新時代的貧困。