滄海桑田/國產大模型急起直追中資AI板塊價值重估\倪相仁

大公報 A11：經濟 2025-01-26

　　過去一周的政經大事不少，對港股的影響也是落地有聲。從周一美國新任總統特朗普正式上任，並迅速打響頭炮：推出涉資5000億美元的「星際之門」AI基建大計，到周五中國政府六部委聯合印發《關於推動中長期資金入市工作的實施方案》，助力股市長遠健康發展。儘管市場最為關注的加徵關稅、財政刺激計劃等議題，仍在雲裏霧裏，但中美兩地市場，卻在AI領域出現共振。如果「星際之門」開展順利，而中國幾大互聯網巨頭又同時加大AI的天量投資，相信對今年的港股市場而言，AI板塊（從數據中心、算力到引用）將會出現一個百花齊放的局面。

　　在AI領域，中美的發展存在着一定的時間差，美國在前中國在後。去年美國大力投資AI算力、建大模型，今年則輪到中國急起直追。從去年底開始，內地的AI領域突然出現了一個個質變，讓原先以為中國在AI大模型的研發已被美國「遙遙領先」的看法，出現了一些疑問。首先是字節跳動（抖音母公司）推出的豆包（AI聊天智能對話問答助手），在內地市場大受歡迎，上客量已躍至全球第二位。接着，由一家年輕初創公司幻方量化推出的AI大模型DeepSeek不鳴則已，一鳴驚人。上周一（20日）國務院總理李強主持召開專家、企業家和教科文衞體等領域代表座談會，聽取對《政府工作報告（徵求意見稿）》的意見建議，DeepSeek創始人梁文鋒出現在8名發言人名單之中，令幻方量化的知名度更上一層樓。

　　在參加總理會議的同一天，DeepSeek在官微上，發布了新版本DeepSeek-R1，其性能對標OpenAI o1正式版。其中R1的32B和70B版本，性能超過OpenAI的GPT-4o，並逼近o1-mini。

　　DeepSeek開創新訓練思路

　　根據業界的看法，自ChatGPT問世兩年以來，DeepSeek R1是國產LLM大模型第一次追平了世界最強大模型的性能。OpenAI定義了大模型訓練的四個階段：預訓練，監督微調，獎勵建模，強化學習。自從OpenAI公布ChatGPT以來，大模型的訓練大致按照這四步訓練法。DeepSeek的驚艷之處，在於直接提出了一個全新的訓練思路：去除或極端弱化第二個步驟（監督微調），直接跳至第四個步驟：強化學習。通俗來說，「監督微調」就是把人類的正確做題結果（問題＋答案）用來調教大模型。而DeepSeek則不用人類知識去調教大模型，而是讓AI自己和自己PK尋找變強的路徑。

　　AI應用領域今年將展升浪

　　中國在AI芯片受制下，仍能夠在大模型方面急起直追，不僅給國人帶來希望之光，也讓投資者更有信心去重估中資AI板塊的價值。須知，首先要建立強大的AI大模型，才有力量推動AI在各方面的引用。另一方面，外媒稱字節跳動今年已規劃資本開支1500億元人民幣，其中很大一部分將集中於人工智能領域。此前，字節跳動已經是英偉達H20 AI芯片的最大買家，此次1500億資本支出的主要受益方為寒武紀（A股上市公司）、華為以及英偉達。

　　周五市場所見，沉寂一段時間的AI應用板塊，亦出現普升。如果去年底的升浪只是預演，今年隨內地AI大模型能力的提升，AI應用領域將會有更好的表現。

讀大公報PDF版面

滄海桑田/國產大模型急起直追 中資AI板塊價值重估\倪相仁

滄海桑田/國產大模型急起直追中資AI板塊價值重估\倪相仁