
- 作者:原文由 Anna Tumadóttir、Sarah Hinchliff Pearson 撰寫;引文、摘要及譯文由 Lucien C.H. Lin 整理,並採 CC BY 4.0 發布。
- 分類:授權與工具(Licenses & Tools)、政策(Policy)
摘要與引文:
承接〈CC Signals 最新進展〉一文,本篇進一步說明 Creative Commons 在 AI 時代的下一步規劃:除了讓創作者表達作品是否願意供 AI 使用之外,更希望建立一套兼顧公共利益與資料治理的新基礎架構,協助資料治理者(data stewards)依不同使用者、不同利用目的,設定資料近用與 AI 利用的實際條件。
Creative Commons 認為,資料的近用與 AI 擷取,不應只有「完全開放」或「完全封閉」兩種選項,而應建立更細緻的治理模式:對以營利為目的的大規模資料利用者,可要求遵守特定條件(如 AI opt-out、姓名標示、透明度及其他保障措施);對研究、教育、文化保存等符合公共利益的利用,則應維持開放近用,以避免現行防禦性封閉措施傷及典藏、研究與知識共享。
此外,Creative Commons 將陸續發布各領域的 AI 暫行指引,協助授權人理解現行 CC 授權在 AI 時代實際會影響哪些利用情境;同時推動 AI 姓名標示(Attribution)的最佳實務與技術實作,並透過公開交流持續吸收社群回饋。另一方面,也將與圖書館、檔案館、研究機構及其他資料治理者合作,發展附條件近用(conditional access)工具,讓不同類型的使用者依其使用目的,在不同條件下近用典藏資料,共同建立兼顧共享資源(Commons)永續、創作者意向與公共利益的 AI 治理架構。
譯文開始:
我們最近分享了 CC Signals 持續演進的最新進展。隨著 AI 系統愈來愈頻繁地在缺乏充分同意(consent)、姓名標示(attribution)或透明度(transparency)的情況下,自共享資源(Commons)擷取價值,若要維繫健全的共享資源(Commons),就必須建立更完善的治理與課責機制。這也反映了 Creative Commons 思維上的一項轉變:從表達偏好(preferences),走向重新平衡權力,以保護共享資源(Commons)。
本文將說明我們如何在 CC Signals 的基礎上持續建構與強化,藉以支持我們一貫的目標——確保人類知識得以永續近用。當前,我們並沒有所有問題的答案。我們有的是,一套足以引導我們持續朝此目標前進的架構(framework)。
回顧:真正的關鍵是什麼?
當議題涉及 AI 時,著作權所適用的法律環境,本身便充滿不一致,且往往界線模糊。因此,CC 授權雖然依然重要,卻已不足以回應作品在 AI 系統中究竟如何被使用的問題。(如欲進一步瞭解,可參閱 Understanding CC Licenses and AI Training: A Legal Primer 這篇文章。)同樣地,在這個由 AI 深度介入(AI-mediated)的世界裡,CC 授權也無法完整承載創作者及資料持有人,對於作品利用方式所抱持的各種不同意向。
如今,在整個網際網路上,創作者、社群及各類機構,正紛紛採取各種「防禦性封閉(defensive enclosure)」措施,以限制外界近用其內容,包括:
- 法律上的措施(例如授權條款):如開放近用(Open Access)出版者開始建議採用 CC BY-NC-ND 作為控制機制,Association for Computing Machinery(ACM)目前已採行此作法;這對人類之間的協作帶來負面影響。
- 技術上的措施(例如 CAPTCHA(人機驗證)、Bot 封鎖、流量限制):如新聞媒體目前所採取的作法;然而,這也對典藏保存(archiving)工作造成不利影響。
- 財務上的措施(例如付費 API):如 X 平台禁止其上貼文被第三方獲取使用;然而,這也對研究人員的工作造成不利影響。
問題是,這些工具將所有機器使用一視同仁,而不管使用目的。在限制 AI 開發者大規模擷取內容的同時,也一併阻礙了研究、典藏保存、無歧視近用等符合公共利益的使用。
雖然我們的研究仍在持續進行中,但目前已經出現一些初步跡象顯示:共享資源(Commons)正逐漸走向更加碎片化,也可能持續萎縮;而那些長久以來公共利益的防護,也正逐步削弱。
建構下一代的分享架構
CC 授權所促成的開放近用(Open Access),建立了一個多元層次的分享光譜(spectrum of sharing)。今天,在 AI 時代,我們也需要一套與之相對應的機制──一個多元層次的參與光譜(spectrum of participation),讓創作者以及資料管理的治理者(data-holding stewards),都能積極參與知識如何被生產、分享,以及被使用。
過去二十五年來,我們共同建立的共享資源(Commons),並不是自然而然形成的。它是透過法律框架、技術標準,以及共同遵循的社群規範(shared norms)來進行設計。而 AI 時代,需要的是下一代的基礎架構(Infrastructure)。我們所期待的未來,是全球知識共享資源依然能夠持續近用;同時,AI 系統也能以透明、可課責,並符合公共利益的方式與之互動。
我們的規劃
Creative Commons 正透過 CC Signals 架構,推動數項具有高度影響力的介入措施(interventions),以重建信任、強化參與,並將公共利益的核心價值,嵌入於 AI 知識生態系之中。
- 協助人們在當前環境下被充分告知後進行決策。
- 讓姓名標示(Attribution)成為 AI 的常態。
- 建立新的工具,在恢復意向代理機制(agency)的同時,也能保障公共利益的使用。
協助人們在當前環境下被充分告知後進行決策
AI 系統目前使用 CC 授權作品的方式,已使許多人開始質疑:現行整套 CC 授權(license suite),是否仍然符合他們原先希望達成的目標。
這些疑慮有許多不同的表現形式:姓名標示(attribution)在 AI 系統中消失了;具有敏感性的知識(sensitive knowledge)脫離了原本的脈絡而被使用;價值與權力愈來愈集中;缺乏明確的互惠(reciprocity)或課責(accountability)機制。然而,這些疑慮都有一個共同的根源:人們已經無法確定,在這個新的環境裡,CC 授權究竟代表什麼。
我們希望,每一位選擇採用 CC 授權的人,都能夠有信心地作出這項選擇。我們也希望,那些已將 CC 授權納入自身政策的各類機構,能夠清楚理解:當面對 AI 時,CC 授權究竟涵蓋哪些事項,又有哪些事項並不在其涵蓋範圍之內。在未來六個月內,我們將針對不同領域,發布各自適用的暫行指引(interim guidance),協助 CC 授權人因應 AI 所帶來的全新課題。這些指引的目的,並不是解決目前所有法律上的不確定性。反而是,在這段充滿不確定性的過渡期間,我們希望維繫正被 AI 危及的分享實踐;並同時發展新的工具與實務做法,以回應社群所提出的各項關切。
Creative Commons 將舉辦一系列依不同領域規劃的線上交流活動,以蒐集各界對這些暫行指引的意見回饋。歡迎訂閱 Creative Commons 電子報;一旦有進一步消息,我們將第一時間與大家分享。
讓姓名標示(Attribution)成為 AI 的常態
姓名標示(Attribution)一直都是共享資源(Commons)的核心基石。它支持參與,促進透明,也使知識得以追溯其來源、接受評估,並在既有成果之上持續建構。
然而,今日的 AI 生態系,正逐漸侵蝕這項長久以來建立的規範。大多數生成式 AI 系統,都未能以具實質意義的方式,揭露其所依據的資訊來源。當 AI 愈來愈成為人們近用知識的重要媒介時,這將帶來極為嚴重的後果:來源脈絡(provenance)的流失;信任的降低;以及人們分享知識的誘因逐漸減少。CC Signals 的第一個版本,先將姓名標示(Attribution)定位為一種偏好(選項);而今天,我們認為:姓名標示(Attribution)必須成為一項預設要求(requirement)!
我們的規劃,是建立 AI 情境下姓名標示的最佳實務(best practices)。AI 開發者經常主張:大型語言模型(LLMs)根本無法做到姓名標示。然而,這是系統設計時所作出的選擇,並不是技術上的必然限制。我們相信,如果能重新思考一個將姓名標示視為核心原則的 AI 生態系,其所發展出的標示實務,將具有重要價值。雖然我們無法讓時光倒回(到 AI 系統設計之初去更動它),但至少,在目前技術上可行的範圍內,我們可以要求 AI 系統提供姓名標示。例如 Retrieval-Augmented Generation(RAG,檢索增強生成),就是一種能夠自特定且可追溯的資料來源擷取內容,再據以產生回應的方法。
我們接下來的工作,將包括:建立 AI 系統、終端使用者,以及創作者的理想姓名標示指引;也將示範如何在 RAG 模型中實現姓名標示。這項工作的推動有兩個目的。第一,建立對 AI 姓名標示目前能做到與尚無法做到的共同理解。第二,提供創作者與 AI 使用者必要的工具,使他們能夠倡議「姓名標示應成為基本期待」。強化姓名標示,有助於確保知識能夠持續廣泛流通,而不會喪失其與創作者及其所屬社群之間的連結。
Creative Commons 目前也希望與投入姓名標示標準制定的專家,以及開發能夠保留姓名標示資訊之 AI 系統的開發者建立合作。如果你正從事相關工作,我們非常期待與你交流。
建立新的工具,在恢復意向代理機制(agency)的同時,也能保障公共利益的使用。
單靠著作權制度,已無法完成這項工作。我們相信,若要維繫一個以人為本的網際網路,就必須建立具有實質意義的防護護欄(guardrails),並透過集體共同維護。我們的目標,是支持一個兼顧開放與意向代理機制(agency)、近用與課責的生態系。
首先,我們主張發展並採用經過審慎界定範圍的 AI 退出機制(AI opt-out),使創作者的意向代理機制(agency)得以維持,同時也能保障符合公共利益的使用。為了回應這項需求,我們已向 IETF(Internet Engineering Task Force,網際網路工程任務小組)——負責制定網際網路基礎標準的組織——提出建議,希望在其 AI Preferences 詞彙(vocabulary)中增列相關項目,以協助在創作者的意向代理機制與公共利益的再利用之間,取得適當的平衡。我們認為,無論是 opt-out 工具本身,或任何與其相關的立法,都必須確保公共利益的使用受到保障。這包括:使文化資產典藏機構(cultural heritage institutions)得以持續保存與分析內容,以及支持非營利研究與教育機構持續推動其工作。
其次,我們也正投入研究與開發一項新的工具,目的在於讓開放共享的收藏(collections)與彙編(compilations),能夠提供附條件的近用(conditional access)。這項工具將使資料治理者(data stewards)得以就收藏或彙編的近用與利用,設定相關條件,以維護其技術基礎架構的永續運作。這些資料治理者,包括圖書館、檔案館、研究機構、資料典藏庫(data repositories)、公共知識計畫,以及文化資產典藏機構等。對於大量且高度消耗資源的資料再利用者,可能需要遵守更多條件;至於符合公共利益的使用,則將完全不受相關條件限制。
如果缺乏足以界定 AI 開發使用條件的實務法律工具,(相關)收藏所能採取的選項,往往只剩下兩種:不是任由 AI 開發者毫無限制地大量擷取內容,就是全面限制近用。然而,這兩種選擇,都無法真正反映多數知識治理者(knowledge stewards)的目標。目前這項研究與開發工作,係建立於與社群成員及利害關係人的密切諮詢之上。例如,過去一年,我們持續與非洲地區的實務工作者展開對話;同時,也參考(相關)活動的廣泛探索成果,例如 Open Future Foundation 對文化資產共享的分析,以及 NOODL 為重新平衡弱勢語言社群權力所進行的發展工作。
許多(資料治理者)希望能夠持續分享其收藏,同時也確保 AI 開發者能以負責任的方式使用這些資源,包括尊重姓名標示(attribution)、確保透明度,以及遵守其他符合其公共利益使命的保障措施(safeguards)。我們希望建立一套工具,使這些要求能夠透過標準化且具有法律拘束力(legally enforceable)的方式加以實現。
下一步會發生什麼?
探索這類工具,意味著 Creative Commons 必須超越單純基於著作權制度的思維。對我們而言,這是一項真正的典範轉移(paradigm shift),也是我們極為審慎看待的一項轉變。我們相信,研究這些能夠支持附條件近用(conditional access)的法律工具,其風險與效益,是維護共享資源(Commons)長期健全發展不可或缺的一環。我們既需要維持珍貴知識資源的近用,也必須確保那些負責治理這些資源的機構與社群,能持續作為 AI 生態系塑造過程中的積極參與者。
目前,我們的工作正進展至此。本月,我們將於倫敦召開一場工作坊,開始深入討論新工具所涉及的設計與治理問題。今年稍晚,我們也將徵求首批試行採用者(pilot adopters),協助我們在實務上測試並持續完善這套方法。我們將隨著工作的推展,持續向大家分享最新進展。
我們已經擬定清楚的行動計畫,並預計於今年內讓上述各項倡議陸續進入試行階段。和許多非營利組織一樣,我們能否加速推動這些工作,取決於所能取得的資源。Open Infrastructure Circle 的支持,使我們得以一路走到今天;值此 Creative Commons 成立二十五週年之際,我們也訂下募集 500 萬美元的目標,以推動下一階段的 CC Signals 發展。如果您願意,也誠摯邀請您支持這項工作。
讓我們攜手共同打造,共享資源(Commons)下一步真正需要的樣貌。
原文發布日期:2026 年 5 月 13 日
#CCSignals #DataStewards #AIGovernance #資料治理 #共享資源