阿里千問新模型 提升生圖改圖能力

  【大公報訊】阿里巴巴(09988)旗下千問公布,千問新一代圖像生成及編輯模型Qwen-Image-2.0,其支持1K token(詞元)的超長文字輸入和2K高分辨率,可準確渲染複雜指令,輕鬆生成專業的PPT(簡報)及信息圖,質感媲美專業級攝影師。Qwen-Image-2.0全新升級,首次將圖像生成和編輯統一到一個模型中去,以更輕量的模型架構,實現了生圖和改圖性能的大幅提升。

  基於Qwen-Image-2.0模型,用家可以與人工智能(AI)協同創作出更豐富、更實用的圖片,比如一句話生成宮保雞丁的做法流程圖,杭州兩日旅遊攻略圖,4x6的多格漫畫組圖,兒童繪本圖,寫實風格的電影海報,極為逼真的綠色叢林等等,也可上傳數張圖片進行編輯,生成諸如九宮格多手勢自拍,真人配字表情包,雙人逼真AI合影,詩詞配圖等。

  另據內地傳媒報道,千問正測試接入大麥,可實現一句話買電影票,實現從影片推薦、智能選座到支付出票的整個流程,這是全球首個能夠幫用戶購買電影票的AI助手。

  騰訊混元記憶體僅600MB

  此外,騰訊(00700)旗下騰訊混元宣布,基於首個產業級2位元(bit)端側量化方案,正式推出一款面向消費級硬件場景的「極小」模型HY-1.8B-2Bit,等效參數量僅0.3B,記憶體佔用僅600MB,較常用的一些手機應用程式還小。

  百度(09888)亦加速出海,旗下百度搜索推出全球搜,實現對全球上千億優質內容的深度索引與理解,已無縫嵌入百度文心助手,而百度百科則推出百度百科國際版BaiduWiki,首批支援英語、法語、西班牙語、俄語及日語等五大語種,正式從中文知識平台邁入全球化知識服務階段。