研究指AI學會說謊 網上遊戲演「無間道」

  香港文匯報訊 專家們長期以來不斷警告人工智能(AI)失控可能帶來威脅,一項新研究報告指出此事已發生。法新社報道,一批科學家在《Patterns》期刊發表的文章說,原本設計為誠實的AI系統,已發展出令人不安的欺瞞技巧,例如欺騙網上遊戲的人類玩家。

  AI行為無法預測不受控

  這份研究報告的作者、美國麻省理工學院研究員帕克說,這類例子暴露出來的潛在問題,可能很快會在現實世界造成嚴重後果。帕克說,能深度學習的AI系統不像傳統軟件那樣由「編寫」而成,而是透過類似選擇性培育的程序逐漸「成長」,換言之AI的行為在訓練背景下看似可預測及可控制,但可能轉眼就變得不受控制且無法預測。

  這支團隊的研究始於美國科企Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為《Diplomacy》的戰略遊戲,獲勝關鍵是結盟。據在《科學》期刊發表的報告,Cicero在遊戲中表現優異,所獲分數排在資深人類玩家前10%。Meta稱Cicero「在很大程度上誠實」,且「絕不會蓄意在背後搞鬼」,但帕克與同事深究完整資料時,發現是另一回事。舉例說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。

  報告作者還認為近期AI有舞弊或不當影響選舉的風險。為降低風險,團隊建議數項措施,例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數碼水印,並研發能偵測AI欺瞞的技術。