【智為未來】訓練數據失衡 致AI性別定型

◆ 圖為與ChatGPT的對話紀錄。 網頁截圖
◆ 圖為與ChatGPT的對話紀錄。 網頁截圖

  原生性別是與生俱來,每個人因着各自的原生性別而有不同的性格和特質。男性普遍體能較佳,女性普遍較細心。事實上,男女天生各有長短。男女會因應先天的特質,而在社會上擔當不同的角色。男性的體能較佳,故此消防員以男性居多;女性較細心,因此護士以女性居多。這情況原本並無不妥,但若然社會上形成一種只有男性才可當消防員、女性才可當護士的觀念,這就是一種性別定型。

  AI加劇性別定型

  性別定型會限制各種性別的發展,並會造成歧視。故此,社會必須竭力打破性別定型。可惜,現今部分的人工智能(AI)技術卻加劇這個問題。以ChatGPT為例,當它被要求把「佢是一名消防員」翻譯成英語時,它會翻譯成「He is a firefighter」;而「佢是一名護士」則翻譯成「She is a nurse」。它變相假定了消防員是男性的職業、護士是女性的職業。另一個性別定型的例子體現於語音助理。語音助理預設的聲線往往是女性,但這會形成一種女性適合擔任服務行業的觀念。

  人工智能帶來性別定型的問題該如何解決?以上述的語言翻譯為例,它的問題很大程度上源於訓練數據的不平衡。

  現實生活中,大多數消防員都是男性,大多數護士都是女性,因此所搜集的訓練數據,較易出現男女比例失衡的現象。所以訓練模型時,必須確保訓練數據有均衡的男女比例。

  在翻譯時,多採用中性的代名詞或名詞,例如「they」、「chairperson」等字。以語音助理為例,研發商可提供不同性別的聲線供用家選擇。研發商也可着力研發一些中性的聲線。

  創科行業倡增女性視角

  此外,由於創科行業以男性居多,若能吸引更多女性投身創科行業,也是解決性別定型的良方。因為,她們可以在科技研發時,以女性的視角提出各種避免性別定型的方案。

  人工智能技術理應為社會帶來正面的影響,若然助長性別定型,必須加以正視。我們期盼研發商持續改善人工智能的產品,締造一個更共融的社會。

  ◆ 中大賽馬會「智」為未來計劃 https://cuhkjc-aiforfuture.hk/

  由香港賽馬會慈善信託基金捐助,香港中文大學工程學院及教育學院聯合主辦,旨在透過建構可持續的AI教育生態系統將AI帶入主流教育。通過獨有且內容全面的AI課程、創新AI學習套件、建立教師網絡並提供AI教學增值,計劃將為香港的科技教育寫下新一頁。