三大硬核技術讓國產算力「跑得穩」

香港文匯報要聞 2026-06-06

　　●「顯存拼圖」：萬億級大模型不可能只塞進一張卡，團隊設計了精密的分布式承載方案，把龐大的模型參數像拼圖一樣，精確地分配到千卡集群的每一張卡上，算力調度明明白白。

　　●「負載均衡」：為了避免MoE模型中有的「專家」忙得夠嗆、有的卻在「閒逛」，團隊專門優化了調度策略，保證了每位「專家」分工合理，跨卡通信不再「堵車」。

　　●「有人『守夜』」：全參數後訓練最怕跑着跑着系統突然崩潰。本次訓練團隊搭建了完整的監控體系，全部實現可視可控，確保了長達1,500多步的訓練過程中，沒有出現一次中斷或報錯。

讀香港文匯報PDF版面