滄海桑田/國產大模型急起直追 中資AI板塊價值重估\倪相仁

  過去一周的政經大事不少,對港股的影響也是落地有聲。從周一美國新任總統特朗普正式上任,並迅速打響頭炮:推出涉資5000億美元的「星際之門」AI基建大計,到周五中國政府六部委聯合印發《關於推動中長期資金入市工作的實施方案》,助力股市長遠健康發展。儘管市場最為關注的加徵關稅、財政刺激計劃等議題,仍在雲裏霧裏,但中美兩地市場,卻在AI領域出現共振。如果「星際之門」開展順利,而中國幾大互聯網巨頭又同時加大AI的天量投資,相信對今年的港股市場而言,AI板塊(從數據中心、算力到引用)將會出現一個百花齊放的局面。

  在AI領域,中美的發展存在着一定的時間差,美國在前中國在後。去年美國大力投資AI算力、建大模型,今年則輪到中國急起直追。從去年底開始,內地的AI領域突然出現了一個個質變,讓原先以為中國在AI大模型的研發已被美國「遙遙領先」的看法,出現了一些疑問。首先是字節跳動(抖音母公司)推出的豆包(AI聊天智能對話問答助手),在內地市場大受歡迎,上客量已躍至全球第二位。接着,由一家年輕初創公司幻方量化推出的AI大模型DeepSeek不鳴則已,一鳴驚人。上周一(20日)國務院總理李強主持召開專家、企業家和教科文衞體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,DeepSeek創始人梁文鋒出現在8名發言人名單之中,令幻方量化的知名度更上一層樓。

  在參加總理會議的同一天,DeepSeek在官微上,發布了新版本DeepSeek-R1,其性能對標OpenAI o1正式版。其中R1的32B和70B版本,性能超過OpenAI的GPT-4o,並逼近o1-mini。

  DeepSeek開創新訓練思路

  根據業界的看法,自ChatGPT問世兩年以來,DeepSeek R1是國產LLM大模型第一次追平了世界最強大模型的性能。OpenAI定義了大模型訓練的四個階段:預訓練,監督微調,獎勵建模,強化學習。自從OpenAI公布ChatGPT以來,大模型的訓練大致按照這四步訓練法。DeepSeek的驚艷之處,在於直接提出了一個全新的訓練思路:去除或極端弱化第二個步驟(監督微調),直接跳至第四個步驟:強化學習。通俗來說,「監督微調」就是把人類的正確做題結果(問題+答案)用來調教大模型。而DeepSeek則不用人類知識去調教大模型,而是讓AI自己和自己PK尋找變強的路徑。

  AI應用領域今年將展升浪

  中國在AI芯片受制下,仍能夠在大模型方面急起直追,不僅給國人帶來希望之光,也讓投資者更有信心去重估中資AI板塊的價值。須知,首先要建立強大的AI大模型,才有力量推動AI在各方面的引用。另一方面,外媒稱字節跳動今年已規劃資本開支1500億元人民幣,其中很大一部分將集中於人工智能領域。此前,字節跳動已經是英偉達H20 AI芯片的最大買家,此次1500億資本支出的主要受益方為寒武紀(A股上市公司)、華為以及英偉達。

  周五市場所見,沉寂一段時間的AI應用板塊,亦出現普升。如果去年底的升浪只是預演,今年隨內地AI大模型能力的提升,AI應用領域將會有更好的表現。