整合信息/商湯升級「日日新」 實時多模態交互


  繼日前推出可控人物視頻大模型Vimi後,商湯(00020)趁召開「大愛無疆·向新力」人工智能論壇,再有新品面世,全面升級「日日新SenseNova 5.5」大模型體系,包括推出內地首個AI交互模式「日日新5o」,對標GPT-4o。

  「日日新5o」大模型通過整合跨模態信息,基於聲音、文本、圖像和視頻等多種形式,實現實時流式多模態交互的創新模式。

  在論壇上,商湯展示「日日新5o」技術,例如工作人員拿出一隻可愛小狗玩具,「日日新5o」能準確描述小狗玩具的外貌、表情,以及穿戴印有商湯科技標誌的白色帽子。工作人員之後翻開一本書,「日日新5o」便能自動識別圖文,並給出理解及總結。

  革命性人機交互變化

  商湯董事長兼首席執行官徐立(圓圖)表示,今年是大模型從單一模態向多模態演進的關鍵一年,集團亦正在向交互性更強的方向邁進。

  他認為,這不僅是技術發展的必然,亦是滿足用戶體驗需求的關鍵,通過應用推動模型能力的發展,結合多模態流式交互的技術進步,將會對人機交互帶來革命性的變化。

  今年4月,商湯發布「日日新5.0」,如今升級至「日日新5.5」,綜合性能平均提升30%,在數學推理、英文能力和指令跟隨能力等亦有所增強。