港首個AI模型 HKGAI V1誕生

實現DeepSeek系統本地化 書寫獅子山下創科傳奇
在人工智能(AI)科技迅猛發展的浪潮中,香港憑藉優秀的科研水平,加上背靠祖國的技術支撐,不單沒有缺席,更推進了整合創新的提升。自今年1月以來,內地AI大模型DeepSeek的發展衝擊全球,由香港科技大學領軍,聯合四所本港及一所海外頂尖大學的人工智能科學家組成的InnoHK香港生成式人工智能研發中心(HKGAI)團隊,在本地生成式AI研發基礎上,昨日正式發布了全國首個基於DeepSeek全參數微調並持續訓練產生的大模型HKGAI V1。該模型依託香港本地獨有數據,實現了DeepSeek的本地化,以及面向國際的出海重塑,同時推進AI的開源與國產化適配。除了服務港人外,HKGAI V1未來更計劃擴展服務,為海外6,500萬的華人社會提供大模型及相應應用。 ●香港文匯報記者 陸雅楠
特區政府創新科技及工業局局長孫東在昨日發布會表示,HKGAI V1的推出是香港AI發展的重要里程碑。自DeepSeek推出震驚世界,HKGAI團隊迅速將其完美的底座模型架構,與自身模型傑出的數據處理功能有機結合,充分體現了在香港「一國兩制」的價值觀,也成就了HKGAI V1強勢推出。他形容,自HKGAI在InnoHK平台下成立,至今推出自己研發的大語言模型,香港的生成式AI發展「歷時一年半,從無到有,書寫了獅子山下一個美好的創科傳奇」。
AI科技浪潮 香港沒有缺席
孫東強調,AI正引領新一輪技術和產業變革,特區政府積極應對,先後建設了人工智能超算中心,推出30億元人工智能資助計劃等,目前僅在科學園和數碼港就匯聚了超過800間AI企業,聚集眾多人才,認為特區政府針對AI發展,方向明確,措施有力,且行動堅決。他強調「在這波以人工智能為代表的科技浪潮中,很高興香港沒有缺席」,又大讚HKGAI的青年科研人員:「你們是最棒的!」
就香港首個基礎大模型HKGAI V1,港科大首席副校長、HKGAI主任郭毅可介紹,這是業界首個基於DeepSeek671B全參數微調,並持續訓練的大模型,團隊以一個月時間完成DeepSeek的香港本地化,而HKGAI V1自研的RAG系統,也實現了從「問題理解到知識檢索,以至內容生成」的全流程智能處理,並提升了模型能力精度。
相信不久開源 讓市民使用
在數字政策辦公室協調下,特區政府已有大約70 個部門參與試用HKGAI 提供的大模型輔助辦公應用系統,處理公務員文書工作,預計活躍用戶將突破數萬。同時,HKGAI V1亦於多個行業建立戰略合作夥伴,推動產業智能化升級。
郭毅可透露,有信心不久後可讓HKGAI V1大模型正式開源,讓香港市民和開發者能夠直接使用,而開源計劃也將進一步激發本港的創新活力,促進產業界、學術界和研究機構的深度合作,推動香港AI產業發展。
HKGAI V1 服務將包含免費和收費兩部分,郭毅可表示,團隊會與特區政府商議,確保大部分功能免費向公眾開放,同時制定逐步開放的時間表,以保障使用公平性。同時期望HKGAI V1 的應用,可讓香港在全球AI領域彰顯東方之珠的獨特風采。
香港本地生成式AI發展歷程
2023年 ChatGPT橫空面世,但面對不對香港地區開放的問題。特區政府迅速籌組、建立香港本土的研發平台,聚集多所本港及境外頂尖大學的力量,在10月成立了InnoHK香港生成式人工智能研發中心(HKGAI)
2024年上半年 HKGAI 開發出第一個大語言模型的版本「港文通」(生成式人工智能文書輔助應用程式)
2024年中 「港文通」率先在創科局開始試用及訓練,其後擴至特區政府其他部門,現時已有大約70個部門參與試用系統
2025年1月 DeepSeek R1推出數日後,團隊在1月25日已經決定使用其開源數據,重新訓練本土人工智能大模型
2025年2月24日 HKGAI 團隊花費約一個月時間,成功推出全國首個 DeepSeek全參數微調大模型HKGAI V1
●整理:香港文匯報記者 陸雅楠