BBC測試4款AI聊天機械人 ChatGPT等屢答錯時事問題

香港文匯報國際 2025-02-12

　　香港文匯報訊英國廣播公司（BBC）周一（2月10日）公布最新研究顯示，人工智能（AI）聊天機械人回答有關新聞時事問題時，經常給出與事實不符、有誤導性，甚至完全虛假的答案。研究測試的4款主要AI聊天機械人ChatGPT、Copilot、Gemini和Perplexity，給出的答案過半數都被認定為問題嚴重，很可能誤導用戶。

　　「英前首相蘇納克仍在任」

　　研究團隊要求測試聊天機械人使用BBC的報道作為資料來源，回答100個時事問題，再由BBC資深記者對答案評分。結果顯示所有AI聊天機械人的答案中，約五分之一在數字、日期或陳述客觀事實方面有明顯錯誤，還有約13%答案引述的BBC報道被更改過，甚至不存在。

　　團隊列舉幾個AI聊天機械人的明顯錯誤。例如科企Google開發的AI助手Gemini聲稱，英國謀殺多名嬰兒的前護士萊特比是否有罪，「取決於每個人的自行判斷」，忽視了萊特比已被裁定謀殺罪成。ChatGPT錯誤表示，巴勒斯坦武裝組織哈馬斯遇刺身亡的領導人哈尼亞依然健在、英國前首相蘇納克和蘇格蘭前首席部長斯特金依然在任。

　　BBC新聞事務行政主任圖爾內斯警告稱，研究結果凸顯現有AI聊天機械人難以在不曲解事實的情況下，提供準確及時的新聞資訊，呼籲AI企業與新聞機構加強合作。

讀香港文匯報PDF版面