【特寫】一個月完成訓練 既是技術突破也是育才

●香港科技大學首席副校長、香港生成式人工智能研究中心主任郭毅可作現場示範。 香港文匯報記者北山彥  攝
●香港科技大學首席副校長、香港生成式人工智能研究中心主任郭毅可作現場示範。 香港文匯報記者北山彥 攝

  郭毅可憶述,團隊將DeepSeek進行本土化改造訓練,是前所未有的嘗試:儘管DeepSeek是開源模型,但許多關鍵信息未公開,過去一個月團隊的青年科研人員不眠不休地從頭學習,在克服巨大挑戰的同時亦做到人才培養。

  「在過程中我深刻感受到AI是年輕人的天下,我們的團隊非常年輕,成員除了來自香港高校外,也包括曾於內地知名企業工作,及在清華大學、北京大學等頂尖學府畢業。隨着項目推進,愈來愈多港科大及其他大學的學生參與其中,這不僅是技術的突破,更是人才的培養。」郭毅可笑說。

  他形容,一眾年輕人充滿幹勁,不眠不休地完成訓練流程的整理與優化,又自主研發了知識庫,標註大量體現香港價值觀的本土文化和知識,讓系統能適切理解香港的風土人情、歷史文化,並與本地主流媒體合作,構建具香港特色的內容體系,進一步提升了模型的本地化應用能力,同時縮短數據整合的時間。

  郭毅可強調,團隊所有訓練數據均在特區政府協調下獲得授權使用,既確保了數據的安全性、正確性及合法性,更尊重了創作者的知識產權。

  他說,在研發過程中,團隊一度面臨算力不足問題,幸在創科局積極協調下,團隊成功調用了數碼港的算力資源,並結合中心現有算力,確保了模型訓練順利進行,最終僅用一個月便完成,且成本控制得當。

  ●香港文匯報記者 陸雅楠