當科幻照進現實 AI機器人離你還遠嗎?

◆AI仿生人形機器人目前能集成60個活動自由度。
◆AI仿生人形機器人目前能集成60個活動自由度。

◆AI仿生人形機器人「魯迅」能邊「抽煙」邊和觀眾交流。
◆AI仿生人形機器人「魯迅」能邊「抽煙」邊和觀眾交流。

◆科技館展示的AI仿生人形機器人製作流程。
◆科技館展示的AI仿生人形機器人製作流程。

◆AI仿生人形機器人生產工廠一角。
◆AI仿生人形機器人生產工廠一角。

◆EX未來科技館陳列的部分1:1復刻AI仿生人形機器人。
◆EX未來科技館陳列的部分1:1復刻AI仿生人形機器人。

◆太空膠囊內的人形機器人足能以假亂真。
◆太空膠囊內的人形機器人足能以假亂真。

當科幻照進現實 AI機器人離你還遠嗎?
當科幻照進現實 AI機器人離你還遠嗎?

  由馮小剛執導,葛優、舒淇領銜主演的《非誠勿擾3》近日在內地公映。片中的AI仿生人形機器人「笑笑」,不僅音容笑貌完全復刻主人公,就連性格特點和行為習慣也是絲毫不差。然而,正如片中人物芒果所說:「機器人畢竟是機器人,溝通起來再順暢那也是程序設定的,感情還得是真的才好。」在科技日益發達的今天,AI技術的迅猛發展甚至讓人們感到一絲恐懼,現實中的我們又會作出怎樣的選擇?◆文、圖︰香港文匯報記者 宋偉

  藝術來源於現實,影片中的AI仿生人形機器人並非子虛烏有。這種曾只出現在諸如《終結者》等科幻作品中的高科技產物,事實上早已走出想像,進入現實。在位於遼寧大連的中國最大仿生人形機器人展館——EX未來科技館裏,觀眾不僅可以「穿越時空」,與魯迅、愛因斯坦等AI仿真人形機器人互動交流,甚至還能在未來以1:1的比例複製自己,定製出同時空下的另一個自我。

  定製「雙向選擇」 成本百萬起步

  基於獨創的仿真技術,館內的愛因斯坦、魯迅、袁隆平等30餘尊AI仿生人形機器人,面部和皮膚觸感與真人皮膚相似,仿生硅膠只有薄薄一層,皮膚紋理與青筋脈絡清晰可見。無論從外觀形象、服裝穿着、說話語音語氣,還是行為動作,都最大程度還原了人物的形象特徵。

  現階段定製一個1:1復刻的AI仿生人形機器人需要花多少錢?EX機器人首席運營官王楓給出了答案——100萬元人民幣以上。他進一步解釋,因涉及建模、結構設計等諸多耗費人力、物力的複雜環節,100萬元人民幣只是一個起步價。「具體成本還要看對機器人的功能需求而定,每項功能都對應不同的軟硬件,需要結構設計師重新設計。」以現有技術,定製一個「頂配版」AI仿生人形機器人,成本將趨近200萬元人民幣,而這還不涉及相關的後期費用。

  「AI仿生人形機器人的後期費用主要產生在購買算力方面,每月花費少則十七八萬,多則過百萬,主要看使用者需求算力的複雜程度和速度。」目前,內地能1:1復刻定製AI仿生人形機器人的企業鳳毛麟角,且定製尚處在「雙向選擇」階段。「目前我們接受定製的都是對國家有傑出貢獻、有社會影響力的公共人物,未來會逐步向大眾放開這一定製門檻。」

  製作耗時月餘 「具身智能」成趨勢

  復刻一個1:1的AI仿生人形機器人需要哪些工序?王楓揭秘,首先就是人體外觀掃描,但掃描出的數據無法直接使用,還需進行3D修復。獲得人體外觀的「點雲數據」後,再通過3D打印機打印模型,將機器人與真人的外觀誤差控制在0.03毫米以內。之後就是結構設計,根據人物身體特點和所需機器人功能,確定電機排布。結構確定後,需進行三至四次驗證,再由設計確定的功能,譬如人物對話、眼睛識別等,進行軟件開發設計,同時確定算力。緊隨其後的則是特效化妝、服裝等細節修正。「這些只是AI仿生人形機器人研發生產的幾大主要步驟,整個製作過程要持續一個多月,而且這一速度已經是內地最快。」

  「具身智能」作為仿生人形機器人的未來發展方向,目前已在業內達成共識。「未來的人形機器人應該是通用型,即什麼工作都能做。一個非常厲害的AI好比靈魂,而這個靈魂有了機器人的軀殼,這就是『具身智能』。」至於AI仿生人形機器人的實際應用,不論是機器人服務員還是機器人護工,服務業毫無疑問是最大市場。「因為農業和工業,需要的都只是機器,只有和人打交道的服務業,才最需要人形機器人。這也是要把AI仿生人形機器人做得非常像真人的目的,要讓它們能自然地融入人類社會。」

  AI助人形機器人能力躍升

  過去一年,以ChatGPT為代表的大語言模型和AI技術飛速發展。在此之前,仿生機器人更多是一種程序設定的機械行為。「通過事先編程,將機械結構做好,讓機器人去模仿人類行動,但事實上它的行為並非智能化。」王楓舉例,如果向機器人提問,它只能在數據庫中搜索是否有相應問題的答案,如果搜索無果,它就會「標準」回覆:「這個答案我還不知道,問點別的吧。」然而隨着AI的發展,由其充當大腦角色的仿生人形機器人已經能「對答如流」。

  顧名思義,人形機器人首先要在外貌上與真人極度相似。在王楓看來,這其實是技術上最難跨越的一步。「因為人體結構非常複雜,哪怕是說一句話,都要牽扯到面部、肢體的大量肌肉活動。「我們現在可統計的人類活動自由度有700個,目前人形機器人自由度最多能達到60個。要把這60個電機完美統一協作,需要非常好的算法。」

  曾預想需要幾十年才能達到的人形機器人人機交互效果,隨着AI技術的突飛猛進,如今已經縮減到十年之內。現階段面世的仿生人形機器人,已經能基於AI實現語音、視覺、問答、運動等功能。對比人類的形、聲、聞、味、觸「五感」,機器人已擁有除嗅覺、味覺之外的其他「三感」。「對機器人而言,看、聽、說三大模塊原本是各自為營,但現在通過多模態融合,AI大腦已能統一處理這三部分。」王楓坦言,以目前的大語言模型,仿生人形機器人儘管能做到100%流利,卻不能做到100%精準。「也就是說,現階段還實現不了像電影中機器人女主人公的智能程度,但距離這一目標實現,相信時間並不會太長。」

  在考慮經濟性的前提下,以當前算力,AI仿生人形機器人能實現10輪左右的流利對話。「但並不意味着現在的AI仿生人形機器人只能進行10輪對話,而是超過之後,需要的算力過大,經濟性會大幅降低,機器人的回應也可能『跑偏』。」