研究指AI學會說謊網上遊戲演「無間道」

香港文匯報國際 2024-05-12

　　香港文匯報訊專家們長期以來不斷警告人工智能（AI）失控可能帶來威脅，一項新研究報告指出此事已發生。法新社報道，一批科學家在《Patterns》期刊發表的文章說，原本設計為誠實的AI系統，已發展出令人不安的欺瞞技巧，例如欺騙網上遊戲的人類玩家。

　　AI行為無法預測不受控

　　這份研究報告的作者、美國麻省理工學院研究員帕克說，這類例子暴露出來的潛在問題，可能很快會在現實世界造成嚴重後果。帕克說，能深度學習的AI系統不像傳統軟件那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」，換言之AI的行為在訓練背景下看似可預測及可控制，但可能轉眼就變得不受控制且無法預測。

　　這支團隊的研究始於美國科企Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為《Diplomacy》的戰略遊戲，獲勝關鍵是結盟。據在《科學》期刊發表的報告，Cicero在遊戲中表現優異，所獲分數排在資深人類玩家前10%。Meta稱Cicero「在很大程度上誠實」，且「絕不會蓄意在背後搞鬼」，但帕克與同事深究完整資料時，發現是另一回事。舉例說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。

　　報告作者還認為近期AI有舞弊或不當影響選舉的風險。為降低風險，團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數碼水印，並研發能偵測AI欺瞞的技術。

讀香港文匯報PDF版面

研究指AI學會說謊 網上遊戲演「無間道」

研究指AI學會說謊網上遊戲演「無間道」