ChatGPT考DSE 一分鐘取佳績

掃碼睇ChatGPT答題及評分
掃碼睇ChatGPT答題及評分

  或影響校本評核結果 AI「進化」將衝擊教育考核

  人工智能(AI)工具ChatGPT自推出以來在教育界引發激烈爭議,對基礎教育以至公開試發展也帶來挑戰。中學文憑試(DSE)今開考,本報讓ChatGPT作答2022年通識科和中史科兩份考卷的選答題,並邀得本港資深教育界人士評分。結果顯示,ChatGPT在不足一分鐘內,通識科能取得3級成績,中史科更獲5級佳績。教育界人士表示,雖然公開試的試場監考形式暫不會受ChatGPT影響,但AI工具能輕易取得不遜於一般學生水平的成績,可能會影響校本評核的結果。同時,隨着各項AI工具的「進化」,答案將越來越精準,將會對中學教育及考核帶來極大衝擊。

  本報選取了2022年DSE通識科卷二延伸回應題第一題予ChatGPT回答。該題目提供了三項關於虛擬祭祀、電子紅包及環保中秋的資料,要求考生根據資料回答並解釋網上祭祀有哪些好處,及表態並論證在多大程度上同意,在現代社會實踐中國傳統習俗時應優先考慮環保。

  在首部分中,ChatGPT的答案驟眼看頭頭是道。在第二部分,ChatGPT表明同意環保因素應優先考慮,及列出三個支持理由並嘗試逐一說明。(問答全文請掃碼)

  無正反作答 通識僅合格

  本報邀請資深通識科教師、立法會議員鄧飛為答案評分。他表示,在共佔8分的首部分中,有關答案可得到6分相等於4級的成績,但ChatGPT所提供的答案未有理會題目提供的資料,只用「常識」作答。

  佔12分的第二部分,評分則為僅僅合格(2級),兩部分合計大約可得3級。鄧飛解釋,題目中的「多大程度上認同」除了要求明確回答認同與否的程度,還要求考生從正反兩面論述對比。在ChatGPT答案中,只說出支持優先考慮環保的理由,卻沒有從反面說出質疑的理由,並不符合考試要求,所以只能僅僅合格。他表示,從答案分析,ChatGPT最大的問題在於未能掌握應試及題型要求重點,因為有些答題技巧未必是從試卷題目中字面顯示,而是通過日常教學及考評局與前線老師溝通等所得。

  本報向ChatGPT發問了2022年文憑試中史科試題卷二單元三「時代與知識分子」的第七題。題目提供了兩份資料,包括孔子輔佐魯定公和齊景公會盟的「夾谷之會」,以及孔子處理魯國中三家擁「百雉之城」貴族的「墮三都」事件,要求考生論析孔子對魯國外交和內政的貢獻,和如何從周遊列國、講學授徒和整體典籍三方面實踐政治理想。

  記者邀請到教聯會副主席、中史科教師穆家駿為有關答案評分,ChatGPT獲評DSE 5級水平。就問題第一部分而言,穆家駿表示,ChatGPT能引用資料中有關「夾谷之會」的文字和史實,分析孔子的外交貢獻,惟在內政方面單純參照資料,沒有引用史實解釋,因此只能獲得10分中的7分。

  在第二部分,穆家駿表示,ChatGPT大致能夠從周遊列國、講學授徒和整理典籍三方面回答題目要求,只是在史實援引方面稍有不足,「其餘整體的表現都不錯」,因此可獲15分中的13分。

  應善用AI輔助 非完全依賴

  就ChatGPT等生成式AI對於中學教育帶來的衝擊和影響,穆家駿認為,很多情況下若學生只是利用AI工具作「頭腦風暴」(Brainstorming)之用,教師與學校確難以分辨,因此重要的是教導學生怎樣善用AI輔助自己學習,而非完全倚賴AI作答。