ChatGPT考DSE 一分鐘取佳績

香港仔 P02 2023-04-21

　　或影響校本評核結果 AI「進化」將衝擊教育考核

　　人工智能（AI）工具ChatGPT自推出以來在教育界引發激烈爭議，對基礎教育以至公開試發展也帶來挑戰。中學文憑試（DSE）今開考，本報讓ChatGPT作答2022年通識科和中史科兩份考卷的選答題，並邀得本港資深教育界人士評分。結果顯示，ChatGPT在不足一分鐘內，通識科能取得3級成績，中史科更獲5級佳績。教育界人士表示，雖然公開試的試場監考形式暫不會受ChatGPT影響，但AI工具能輕易取得不遜於一般學生水平的成績，可能會影響校本評核的結果。同時，隨着各項AI工具的「進化」，答案將越來越精準，將會對中學教育及考核帶來極大衝擊。

　　本報選取了2022年DSE通識科卷二延伸回應題第一題予ChatGPT回答。該題目提供了三項關於虛擬祭祀、電子紅包及環保中秋的資料，要求考生根據資料回答並解釋網上祭祀有哪些好處，及表態並論證在多大程度上同意，在現代社會實踐中國傳統習俗時應優先考慮環保。

　　在首部分中，ChatGPT的答案驟眼看頭頭是道。在第二部分，ChatGPT表明同意環保因素應優先考慮，及列出三個支持理由並嘗試逐一說明。（問答全文請掃碼）

　　無正反作答通識僅合格

　　本報邀請資深通識科教師、立法會議員鄧飛為答案評分。他表示，在共佔8分的首部分中，有關答案可得到6分相等於4級的成績，但ChatGPT所提供的答案未有理會題目提供的資料，只用「常識」作答。

　　佔12分的第二部分，評分則為僅僅合格（2級），兩部分合計大約可得3級。鄧飛解釋，題目中的「多大程度上認同」除了要求明確回答認同與否的程度，還要求考生從正反兩面論述對比。在ChatGPT答案中，只說出支持優先考慮環保的理由，卻沒有從反面說出質疑的理由，並不符合考試要求，所以只能僅僅合格。他表示，從答案分析，ChatGPT最大的問題在於未能掌握應試及題型要求重點，因為有些答題技巧未必是從試卷題目中字面顯示，而是通過日常教學及考評局與前線老師溝通等所得。

　　本報向ChatGPT發問了2022年文憑試中史科試題卷二單元三「時代與知識分子」的第七題。題目提供了兩份資料，包括孔子輔佐魯定公和齊景公會盟的「夾谷之會」，以及孔子處理魯國中三家擁「百雉之城」貴族的「墮三都」事件，要求考生論析孔子對魯國外交和內政的貢獻，和如何從周遊列國、講學授徒和整體典籍三方面實踐政治理想。

　　記者邀請到教聯會副主席、中史科教師穆家駿為有關答案評分，ChatGPT獲評DSE 5級水平。就問題第一部分而言，穆家駿表示，ChatGPT能引用資料中有關「夾谷之會」的文字和史實，分析孔子的外交貢獻，惟在內政方面單純參照資料，沒有引用史實解釋，因此只能獲得10分中的7分。

　　在第二部分，穆家駿表示，ChatGPT大致能夠從周遊列國、講學授徒和整理典籍三方面回答題目要求，只是在史實援引方面稍有不足，「其餘整體的表現都不錯」，因此可獲15分中的13分。

　　應善用AI輔助非完全依賴

　　就ChatGPT等生成式AI對於中學教育帶來的衝擊和影響，穆家駿認為，很多情況下若學生只是利用AI工具作「頭腦風暴」（Brainstorming）之用，教師與學校確難以分辨，因此重要的是教導學生怎樣善用AI輔助自己學習，而非完全倚賴AI作答。