實踐學習/國產AI從「能推理」到「能訓練」
深圳河套學院聯合多家單位組成的項目團隊僅用1個月時間,依託昇騰910C國產AI算力集群,完成DeepSeek-V4-Pro 1.6萬億參數大模型訓練。學院數據指出,是次訓練團隊將一個1.6T MoE模型,在千卡集群上以27秒每步的穩定節奏,連續奔跑1500餘步──這是可復現、可工程化交付的穩定能力。
團隊圍繞工業級自動化運籌建模場景,在數周內完成了從數據生產、樣本篩選、訓練鏈路打通到效果評測的閉環驗證,印證了國產算力平台不僅能夠「訓大模型」,更能「訓好行業模型」──以短周期、低成本構建面向專業任務的增強能力。
此外,是次實踐將萬億級模型訓練攻關作為「練兵場」,把學生直接嵌入國產算力真實訓練場景,在真實攻關中培養「能訓大模型」的人,成為一次人才培養模式的範式實驗。截至目前,項目已培養學生42名。
學院方面認為,是次訓練驗證了一條道路:國產開源旗艦模型+國產AI算力+高水平訓練團隊+國產廠商技術支持。國產AI基礎設施,不再只是「能推理」,而是真正「能訓練、能訓穩、能訓優」。