內地大模型有望超越GPT-4 Turbo
香港文匯報訊(記者 倪夢璟 上海報道)大模型開源開放評測體系司南(OpenCompass2.0)昨日揭曉了年度大模型評測榜單,對過去一年來主流大模型進行全面評測診斷。分析結果顯示,OpenAI發布的GPT-4 Turbo在各項評測中均獲最佳表現,但在中文語境中,內地廠商近期發布的模型更有優勢,且在綜合測評中,來自內地的智譜清言GLM-4、阿里巴巴Qwen-Max、百度「文心一言」4.0緊隨GPT-4 Turbo,分別位列第二至第四名。在接受香港文匯報記者採訪時,上海人工智能實驗室領軍科學家林達華表示,內地大模型發展迅速,且對於中國使用者來說,中文大模型明顯更適合中國的語境,並預計今年內地大模型發展將超越現有OpenAI最先進的GPT-4 Turbo水平。
內地大模型中文語境優勢彰顯
此次,內地大模型智譜清言GLM-4、阿里Qwen-Max以及百度「文心一言」4.0都獲得不錯的成績。個體比較方面,目前「文心一言」相對語言能力方面更加有優勢,阿里Qwen-Max則更加擅長數學推理等。儘管總體而言,內地大模型綜合評分較低於OpenAI 發布的GPT-4 Turbo,但林達華直言內地大模型發展速度超乎想像,「不少國內廠商近期新發布的模型在多個能力維度上正在快速縮小與GPT-4 Turbo的差距,我們也期待隨着更多廠商的新模型發布,我們也相信,今年內,國內廠商的新模型就可以超越外國廠商如OpenAI目前的最強水平,尤其是部分模型,已經在中文場景實現了部分維度上對GPT-4 Turbo的超越。」