可以使用 CC 授權的素材來訓練 AI 嗎?
「是否可以合法取用他人以 CC 授權條款發布之資料與素材,用於生成式 AI 模型的訓練?而訓練完成後的模型及其輸出,是否仍受原 CC 授權條款的拘束?若可取用,使用上的界線為何?若不可,又會涉及哪些法律風險?」
若採極短版的模式來回應前述提問:
1、原則上是可以的。從著作授權的角度,使用依 CC 授權釋出的素材來進行 AI 訓練,在法律上通常是被允許的。
2、但訓練後的產出是否仍受原 CC 授權條款拘束,關鍵在於原著作表達是否仍具體呈現。若是,其對應的 BY(姓名標示)、SA(相同方式分享)、NC(非商業使用)、ND(禁止改作)元素皆可能產生效力。
3、除非使用情境僅涉及探勘事實資訊(Text and Data Mining, TDM)或可主張合理使用且成功抗辯,否則仍須遵守 CC 授權條款所附帶的義務與限制。