創科路上/新一代港產AI登場 更高效更本地
國家「十五五」規劃明確提出全面實施「人工智能+」,特區政府正多管齊下完善AI生態圈。香港生成式人工智能研發中心(HKGAI)昨日(3日)發布最新版本本地大模型HKGAI V3,新一代模型追求「更高效、更睿智、更本地」。HKGAI亦同步推出全港首個生產力級超級智能體「Agent Workshop」。
創新科技及工業局局長孫東在發布會上表示,HKGAI標誌着香港沒有缺席人工智能浪潮,而V3版本的面世,更意味着「我們不僅沒有缺席,更正在逐漸走向前列」。\大公報記者 林天
孫東:讓市民獲得更優質體驗
孫東指出,V3是以本地數據訓練為基礎的大模型,能處理兩文三語,掌握香港獨有語境與文化,期望升級後的模型提供更貼地的垂直應用,優化「港文通」、「港話通」等,讓市民獲得更優質的智能體體驗。他透露,政府將成立「AI+與產業發展策略委員會」,香港人工智能研發院亦將投入運作,加速成果轉化。
HKGAI主任、香港科技大學首席副校長郭毅可強調,新一代模型追求「更高效、更睿智、更本地」,目標是成為「最懂香港政企業務的『數字香港人』」。他解釋,預訓練大模型如同「養育孩子」,通用能力再強,若不與本地法規、社會價值觀對齊,就無法「懂分寸」;單純的技術參數已失去意義,真正拉開差距的是本地化與安全合規。
提高效率方面,郭毅可指出,V1模型曾被批評速度太慢,因而HKGAI團隊在V1等模型基礎上進行了大量研究,優化模型存儲、吞吐量等方面,可以大幅減少等待時間。相比上一代,V3的Token壓縮效率提升超過10倍,使V3在香港本地模型中的整體性能相當出色。
郭毅可續指,V3的一個重要特點是將相關知識嵌入模型,令模型更加睿智。為此,團隊重新進行了全參數微調,建立知識庫,特別是把大量香港本地知識轉化為訓練數據。他解釋,傳統模型需要大量搜索才能拼湊答案,現在因為知識已在模型內部,搜索變得非常簡單,推理更直接、更準確。
輸出更貼近本地語境與習慣
另外,團隊將香港的文化基因嵌入模型的「神經元」,令V3的輸出較前代更貼近香港本地的語境與習慣。郭毅可將模型比作人腦─人腦有區域負責理解語言,有區域負責組織語言;模型同樣要先理解,把語言轉換成向量,再生成表達。他舉例指出,香港部分語境下「尿袋」代表「充電寶」,普通話「打車」在粵語中講「截的士」等,團隊均有特別訓練,目前模型在兩文三語中均達到較高準確度。
在V3的基礎上,團隊全面升級了旗下的多款應用。其中面向政府方面,V3整合了「港話通」的語音查詢、「港會通」的會議記錄自動生成與「港文通」的政府公文撰寫三大核心能力,實現從語音查詢到公文撰寫的端到端自動化處理,並新增多模態報告生成功能,可生成文字、表格、數據圖、插圖等。目前,港文通已服務近5萬名公務員,深度學習香港公文格式與語言習慣。
而面向市民的智能助理「港話通」今日(4日)更新,新增代理能力,並提升對話流暢度與任務執行能力;而全新推出的「念念」提供全場景數字記憶服務,依託多模態交互技術,可用於生成傳記、人生微電影及交互數字人,形成個人的記憶世界模型。
HKGAI亦同步推出全港首個生產力級超級智能體「Agent Workshop」,該智能體基於V3和人機共生網絡「ClawNet」搭建,可部署於政府部門及企業,用戶只需下達指令,系統即可一鍵生成專業PPT、深度撰寫諮詢報告或快速搭建AI應用模型。測試中該智能體可單次無干預穩定運行長達28小時,無干預連續運行時長較上一代增長近百倍。而作為其底層開發框架的「ClawNet」,經過半年多測試確保安全後,今日亦將上線開源社區。該框架可供企業及科研機構開發自定義智能體,降低開發門檻,加速商業化。
與三大電訊商合作 服務出海
此外,HKGAI與浪潮雲及中國移動國際、中國聯通國際、中國電信國際三大電訊營運商合作,向海外開放多樣化推理算力和智能服務,即「Token出海」。郭毅可表示,出海是重要戰略,而將模型適配不同政治環境的能力是香港的寶貴經驗。他又透露,HKGAI將由政府資助的研究中心逐漸走向商業化,目前,已與京東等企業簽約。