商湯推大模型粵語版 7·1起免費開放
人工智能(AI)軟件公司商湯科技(00020)昨日面向企業用戶推出「日日新語言大模型粵語版」(簡稱「日日新粵語版」)應用程序界面(API),並計劃於7月1日推出「SenseChat粵語版」及「商湯企業級大模型一體機」。商湯表示,「SenseChat粵語版」的網頁端及手機應用程式將永久免費開放給香港個人用戶,並稱其較OpenAI的ChatGPT4更熟悉粵語及香港文化。受消息刺激,商湯股價昨日升4.58%,收報1.37元。/大公報實習記者 蔣夢宇
商湯科技首席執行官徐立指出,生成式人工智能大模型需要融合廣泛的基礎知識,因此面臨地域文化的差異。他認為,大模型的應用落地需要服務於本地文化,故推出「日日新粵語版」填補本地市場空白。
未來擬進軍多語種市場
商湯管理層指出,香港作為以中華文化為主的多元文化社會,具有多語言環境的複雜性及文化的多樣性,為語言大模型訓練帶來了極大的挑戰。商湯香港業務總經理馮愈表示,SenseChat粵語版在原有大模型的基礎上利用約6B Tokens的數據進行粵語訓練,其中收錄不同年代的香港俚語、俗語,包括時興的「潮語」及香港特有的中英混用表達習慣,又稱輸出內容會確保「老少皆宜」。
馮愈表示,考慮到仍未見其他大模型進入粵語市場,料商湯產品在香港市場可取得領先地位,此前已與來自金融、醫藥及建築等垂直行業及特區政府的部門進行溝通。他透露,日後有意前往多語種市場,如新加坡、泰國及馬來西亞,發展針對小語種的大模型。
建AI計算中心需三項條件
關於AI行業的監管及風險問題,馮愈表示,目前市場發展空間大,處於供不應求的階段,商湯首要任務是加大算力,並指若在香港建設人工智能計算中心(AIDC),則需要解決電力、人才及土地不足等問題。徐立則表示,跨時代科技所帶來的產業發展往往無先例可循,重新定義行業的過程中必將伴隨模式的來回探索、持續的大規模技術投入,以及商業模式的打磨。
經過迭代更新,是次發布的粵語大模型在知識、推理、數學、代碼等方面的表現均對標ChatGPT-4 Turbo。發布會上,商湯利用粵語俗語、港星照片及地標建築展示了「SenseChat粵語版」的理解、思考、生成的能力。該產品目前已具備文字及語音交互功能、多模態文檔功能,及粵語的文字轉語音及語音識別功能,並支持上載最多50個文檔。據商湯稱,「日日新粵語版」API的價格是目前全網旗艦大模型最便宜,輸入及輸出費用均為每100萬Tokens(詞元)只需30元。
是次發布會,商湯與德勤中國、香港電訊(06823)及隸屬於吉利科技集團創新業務板塊的長興吉數科技簽署合作備忘錄。各方將在SenseChat粵語大模型應用、市場開拓、人工智能服務應用及算力資源等方面探討合作。