BBC測試4款AI聊天機械人 ChatGPT等屢答錯時事問題

  香港文匯報訊 英國廣播公司(BBC)周一(2月10日)公布最新研究顯示,人工智能(AI)聊天機械人回答有關新聞時事問題時,經常給出與事實不符、有誤導性,甚至完全虛假的答案。研究測試的4款主要AI聊天機械人ChatGPT、Copilot、Gemini和Perplexity,給出的答案過半數都被認定為問題嚴重,很可能誤導用戶。

  「英前首相蘇納克仍在任」

  研究團隊要求測試聊天機械人使用BBC的報道作為資料來源,回答100個時事問題,再由BBC資深記者對答案評分。結果顯示所有AI聊天機械人的答案中,約五分之一在數字、日期或陳述客觀事實方面有明顯錯誤,還有約13%答案引述的BBC報道被更改過,甚至不存在。

  團隊列舉幾個AI聊天機械人的明顯錯誤。例如科企Google開發的AI助手Gemini聲稱,英國謀殺多名嬰兒的前護士萊特比是否有罪,「取決於每個人的自行判斷」,忽視了萊特比已被裁定謀殺罪成。ChatGPT錯誤表示,巴勒斯坦武裝組織哈馬斯遇刺身亡的領導人哈尼亞依然健在、英國前首相蘇納克和蘇格蘭前首席部長斯特金依然在任。

  BBC新聞事務行政主任圖爾內斯警告稱,研究結果凸顯現有AI聊天機械人難以在不曲解事實的情況下,提供準確及時的新聞資訊,呼籲AI企業與新聞機構加強合作。