智能答題/AI答題 語言華麗欠缺個體思考
6月7日,高考語文考試結束後,網友們已經開始用AI「雲審題」「雲寫作」。圍繞今年北京卷作文題,有媒體組織了一場AI同題寫作測試,選取了5款當前較受關注的AI大模型,分別為ChatGPT5.5、Gemini 3.1 Pro Preview,以及國產大模型DeepSeek、抖音「豆包」、阿里「通義千問」,對其在高考作文場景下的表現進行比較。並邀請北京中學語文特級教師李朝暉對此進行了匿名評閱。總分50分的作文,5款AI大模型得分為38-47分。
另有媒體選取了豆包、千問、DeepSeek、訊飛星火、智譜、Kimi、Minimax、Gemini、ChatGPT等9款國內外主流AI大模型,進行上海卷高考作文測評。在完成作答後,全國青少年「春蕾杯」徵文比賽、魯迅青少年文學大賽指導專家楊小晴和河南省骨幹教師李來明參與閱卷。總分70分,9款AI大模型得分在61-65.5之間。
專家認為,大模型已經能夠在極短時間內生成一篇結構完整、觀點明確、語言流暢的文章。不過,在閱卷專家們更細緻的評判標準下,決定分數高低的關鍵,往往不只是「寫出來了沒有」,而是「想明白了沒有」。有的文章立意穩妥,卻缺乏進一步推進;有的語言流暢華麗,卻始終停留在相對安全的表達區間;還有一些作文雖然材料充足、例證常見,卻少了能夠體現個體思考的具體判斷,因而難以真正拉開差距。換句話說,AI可以擴展表達的邊界,也可能讓表達變得更平滑、更安全;它豐富了人們的想像工具,卻未必天然生成真正屬於「我」的想像。\大公報記者江鑫嫻