實踐學習/國產AI從「能推理」到「能訓練」

大公報 A13：內地 2026-06-06

圖：項目團隊將萬億級模型訓練攻關作為「練兵場」，把學生嵌入國產算力真實訓練場景，培養「能訓大模型」的人。

　　深圳河套學院聯合多家單位組成的項目團隊僅用1個月時間，依託昇騰910C國產AI算力集群，完成DeepSeek-V4-Pro 1.6萬億參數大模型訓練。學院數據指出，是次訓練團隊將一個1.6T MoE模型，在千卡集群上以27秒每步的穩定節奏，連續奔跑1500餘步──這是可復現、可工程化交付的穩定能力。

　　團隊圍繞工業級自動化運籌建模場景，在數周內完成了從數據生產、樣本篩選、訓練鏈路打通到效果評測的閉環驗證，印證了國產算力平台不僅能夠「訓大模型」，更能「訓好行業模型」──以短周期、低成本構建面向專業任務的增強能力。

　　此外，是次實踐將萬億級模型訓練攻關作為「練兵場」，把學生直接嵌入國產算力真實訓練場景，在真實攻關中培養「能訓大模型」的人，成為一次人才培養模式的範式實驗。截至目前，項目已培養學生42名。

　　學院方面認為，是次訓練驗證了一條道路：國產開源旗艦模型＋國產AI算力＋高水平訓練團隊＋國產廠商技術支持。國產AI基礎設施，不再只是「能推理」，而是真正「能訓練、能訓穩、能訓優」。

讀大公報PDF版面