話你知/建授權數據生態利AI創新

大公報 A2：內地 2025-02-01

　　使用數據訓練AI大模型，有潛在侵權風險，特別是當訓練數據涉及受版權保護的內容、個人信息或受限制的商業數據。2023年，美國紐約時報起訴OpenAI與微軟，指控ChatGPT在未經授權的情況下複製其文章內容用於訓練，且生成的回答可逐字復現原文段落，侵犯版權。爭議焦點在於，模型輸出是否構成「演繹作品」，以及訓練階段的臨時數據複製是否適用「合理使用」。簡單來說，該案涉及「數據價值分配權」，判決結果將重塑AI行業的數據獲取成本與創新速度。隨着數據抓取時代邁步「合規化」，授權數據生態逐步的建立，對推動AI創新具有重大意義。

讀大公報PDF版面

話你知/建授權數據生態 利AI創新

話你知/建授權數據生態利AI創新