大公報綜合彭博社、《衛報》、《環球時報》報道:近日,研究人員宣布,在一項名為「維蘇威挑戰」的比賽中,3名學生成功使用人工智能(AI)破解了2000年前的羅馬帝國著名卷軸文物中的部分內容,揭開了一份古代哲學著作的神秘面紗,並贏得70萬美元(約547萬港元)大獎。評論指,學生們破解「赫庫蘭尼姆古卷」,為AI技術完整破解古卷的剩餘內容鋪平了道路,這或將對人們理解古代世界產生革命性的影響。
公元79年,意大利維蘇威火山噴發,山下繁榮的龐貝城被火山熔岩掩埋,附近的小鎮赫庫蘭尼姆也被波及。1752年,工人挖掘維蘇威火山掩埋的古代別墅時,發現約800卷被燒毀的卷軸,這批卷軸被稱為赫庫蘭尼姆古卷。多年來,科學家們都試圖識別赫庫蘭尼姆古卷上的文字,但卷軸碳化嚴重,無法輕易被打開閱讀。
過去20年來,美國肯塔基大學EduceLab的西爾斯教授(Brent Seales)團隊使用X光技術和電腦技術,對該卷軸進行研究。2023年,「維蘇威挑戰」發起,為能夠從碳化卷軸中提取文字的研究人員提供獎勵,並成功吸引硅谷企業家Nat Friedman和Daniel Gross等人贊助。
古卷探討快樂的來源
2023年10月,「維蘇威挑戰」官網發布公告指,美國內布拉斯加大學林肯分校21歲電腦科學專業學生法里托和德國柏林自由大學的埃及研究生納德爾,利用自行開發的機器學習算法識別古希臘字母,在古卷的一個4平方厘米區域中,成功提取出了古希臘單詞「πορφúραc」,即「紫色」。
此次研究成果,讓法里托成為兩千年來,第一個從未打開的卷軸中看到完整單詞的人,他也因此獲得40000美元(約31.3萬港元)的「首字母獎」獎金。比賽發起人之一Nat Friedman則在社交網站X表示,是次成果是研究中的重大突破,使「西爾斯教授和EduceLab團隊20年來工作成果終能實現」。
本月5日,「維蘇威挑戰」公布了去年的獲獎結果,法里托、納德爾以及瑞士蘇黎世聯邦理工學院機器人學的學生席利格組成的團隊,通過機器學習算法,成功破解了卷軸上超過2000個希臘字母,獲得了70萬美元的大獎。獲獎作品展示了15列文本中的數百個單詞,相當於卷軸5%左右的內容量。文本內容探討了快樂的來源,包括音樂、刺山柑的味道和紫色。該獎項的評審之一、英國布里斯托爾大學的古典學家福勒將其稱為「一個歷史性的時刻」。
精簡算法避免「AI幻覺」
據報道,由於機器學習模型可能出現「AI幻覺」,在破譯卷軸時可能會「編造」看起來與訓練資料相似的文字或圖片,影響準確性。為此,研究人員採取了多種方法以減少AI犯錯的可能性。
其中一種方法是縮小AI模型輸入和輸出值的範圍:AI墨水偵測模型並不基於希臘字母、光學字元辨識或語言模型,也不會直接識別出卷軸上的文字,相反,它們只需獨立地檢測CT掃描中的微小墨點,並輸出「有墨點」或「無墨點」的結果。當墨點聚集在一起後,就會拼湊出文字。因此,AI識別出的文字並不是機器學習模型「想像」出來的,而是直接與CT掃描中的基礎資料相關聯,大大減少了出現「AI幻覺」的幾率。
今年目標破解90%內容
這項成就震動了古代研究領域。美國加州洛杉磯J·保羅·蓋蒂博物館的古物館長拉帕廷表示,這簡直是「白日夢成真」。他說,本次對古卷的成功破譯,意味着研究人員先前因種種原因放棄破譯的數百卷卷軸,將有可能借新技術一同重見天日。赫庫蘭尼姆古卷中可能記載着更多希臘哲學的內容,其他一些用拉丁文撰寫的卷軸則涵蓋了更廣泛的主題領域。通過破譯這些卷軸,人們或將有機會找回荷馬、薩福等作家已失傳的詩歌和文學。
「維蘇威挑戰」將於今年繼續進行,下一步的目標是破解整張卷軸。弗里德曼已經宣布了今年該挑戰的一系列新獎項,劍指在年底前閱讀90%的卷軸內容。但他同時也表示,能走到目前這一步「感覺就像是個奇跡」。
現代科學與考古
放射性碳定年法
•放射性碳定年法是現代考古學中重要的技術,利用碳14的放射性準確測定有機材料的年代。上世紀90年代,科學家藉此法粗略確定了死海附近發現的大以賽亞卷軸的年代。
CT掃描
•CT掃描在考古中被稱為「古放射學」,主要用於檢查木乃伊遺骸,可生成軟組織、器官和體腔的影像,且不會對標本造成任何損壞。
探地雷達
•探地雷達(GPR)是一種非侵入性技術,使考古學家能夠窺視地表以下的情況,有助於識別建築物、墓地、隧道和考古文物的位置,以進行更有效的挖掘。
光學雷達
•光學雷達(LiDAR)是一種類似X射線成像的技術,考古學家可藉此測繪隱藏的物體和結構。在墨西哥,考古學家利用光學雷達發現了近500個由瑪雅人和奧爾梅克人建造的新中美洲遺址。
赫庫蘭尼姆古卷事件簿
公元79年
•意大利維蘇威火山噴發,山下的龐貝城被火山熔岩掩埋。附近的富裕小鎮赫庫蘭尼姆亦被波及,一座豪華別墅及其中的卷軸圖書館被掩埋。火山碎屑流的熱量導致卷軸碳化,但同時隔絕了氧氣,使其得以保存。
1750年
•一名意大利農場工人在挖井時意外發現了赫庫蘭尼姆被掩埋的紙莎草別墅,隨後800張卷軸也被發現。其中一些卷軸包含用希臘語寫成的哲學文本。這些卷軸極度脆弱,無法閱讀。
2015年
•美國肯塔基大學西爾斯教授領導的團隊利用X射線斷層掃描和電腦視覺,成功在不展開一張古代卷軸的情況下讀取了卷軸內容。此後,「虛擬展開」技術不斷發展,後續的工作表明,赫庫蘭尼姆古卷的內容也可以通過X射線斷層掃描檢測,為「維蘇威挑戰」奠定了基礎。
2023年
•3月,西爾斯教授和硅谷企業家發起了「維蘇威挑戰」,召集全球研究者,通過電腦視覺、機器學習等技術,從赫庫蘭尼姆古卷中提取文字,並向在閱讀工作上做出傑出貢獻者頒發超過100萬美元的獎金。在首屆挑戰賽期間,研究人員已成功展開並閱讀了其中一張卷軸5%左右的內容。
AI協助三星堆文物修復
近年來,AI已被應用於一些文物修復工作。去年3月,中國四川省文物考古研究院已與騰訊SSV數字文化實驗室啟動合作,以三星堆為試點,嘗試通過人機協同AI智能的方式,輔助文物修復工作。專家預測,未來AI技術將廣泛應用於考古研究,幫助中國進行該領域的國際交流。
去年7月,四川省三星堆博物館新館正式向遊客開放,逾1500件文物出展,其中更有近600件文物為首次亮相。在展出的文物中,多件三星堆「重器」文物在AI修復、3D打印、三維數據復原、多媒體沙盤摺幕等科技手段的輔助下,通過3D打印製作的原比例研究性復原仿製品,在兼顧文物保護需求的基礎上出展,重現了文物的原貌。
一些三星堆文物年代久遠、造型複雜,且其部件從不同的祭祀坑中挖掘而出。考慮到其結構的安全性,將其碎片組裝在一起幾乎是不可能的。但通過利用AI和3D打印技術,例如青銅神壇、青銅騎獸頂尊人像、青銅鳥足神像等重量級文物得以「數字化修復演示」的展陳方式,再次呈現在了人們眼前。
預計在未來,AI技術將在中國實現考古數字化,有助於建立該領域清晰完整的結構,促進中國與世界考古的融合。
(來源:大公報A22:國際 2024/02/15)