話你知/建授權數據生態 利AI創新

使用數據訓練AI大模型,有潛在侵權風險,特別是當訓練數據涉及受版權保護的內容、個人信息或受限制的商業數據。2023年,美國紐約時報起訴OpenAI與微軟,指控ChatGPT在未經授權的情況下複製其文章內容用於訓練,且生成的回答可逐字復現原文段落,侵犯版權。爭議焦點在於,模型輸出是否構成「演繹作品」,以及訓練階段的臨時數據複製是否適用「合理使用」。簡單來說,該案涉及「數據價值分配權」,判決結果將重塑AI行業的數據獲取成本與創新速度。隨着數據抓取時代邁步「合規化」,授權數據生態逐步的建立,對推動AI創新具有重大意義。