
原文由 Creative Commons 撰寫、譯文由 Lucien C.H. Lin 整理,併採 CC-BY-4.0 發布。
深入了解我們目前的初步構想,並協助塑造下一步的方向!我們希望得到你對這項工作在 法律、技術與社會層面 的想法、回饋與問題。
❓以下問題我們特別想聽取你的意見:
- CC Signals旨在要求 AI 開發者採取「互惠回報」。在你看來,AI 生態中的「互惠性」應該是什麼樣子?我們該如何改進所提議的信號配套,以更好地實現這些互惠性?
- 社群治理將是決定 CC Signals 何時以及如何應用的關鍵。你認為內容維護者應如何做出決策?在這些決策中,誰的偏好最重要?
- CC Signals 優先強調標準化與機器可讀性,以提升其效用,但這也帶來代價。我們應如何在「特定情境考量」與「集體行動目標」(促使大規模採用者改變行為)之間做取捨?
歡迎你透過分享回饋參與討論。
CC信號 (The CC Signals)
🏁從這裡開始:如果你還沒有讀過,請先參考我們的「情境與考量」文件,它構成了 CC Signals 發展的背景。你也可以下載完整報告。
當你已經理解了基本背景,讓我們挖掘更多的細節。
CC Signals 的想法很簡單。透過 CC Signals,大型內容收藏的維護者可以表達一組 AI 開發者必須遵守的條件。這些條件圍繞不同層面的「互惠性」設計,目的是推動有意義、可實踐的舉措。
CC Signals 同時被設計為 機器可解讀 與 人類可理解。
CC Signals 的組合元素




這項計畫受到 AI 討論中常見的幾個基本概念啟發——同意、補償與名譽標示——但我們的切入角度比較特別:驅動我們此一方案的目標是增加並維繫公眾對知識的開放存取。
每一種信號都包含內容得被機器採用的條件。也就是說,AI 開發者必須滿足這些條件才能使用內容進行 AI 開發。所有條件的設計都是為了在相當規模機器採用裡,推動有意義且可實踐的互惠性。我們的初步提案包括以下信號要素:
名譽標示:你必須依據使用方式、手段與情境,提供適宜的名譽標示。
直接回饋: 你必須向「聲明方」提供金錢或相類支持,用於該方資產的開發與維護;此支持應基於善意評估,考量你對資產的使用情況以及你的獲利手段。
生態系回饋: 你必須對你所受益的生態系統提供金錢或相類支持,基於善意評估,考量你對資產的使用情況以及你的獲利手段。
保持開放: 使用(內容)的 AI 系統必須是開放的。例如,必須符合「模型開發框架 (Model Openness Framework, MOF) 的 II 級或 I 級,或符合「開源AI定義 (Open Source AI Definition, OSAID)」。
🗒️注意:「名譽標示」被納入在每一種信號(組合)中,因為我們相信這是最基本的互惠形式,有助於知識循環。除「名譽標示」外,其他信號元素在本提案中是互斥的。信號(元素)列表刻意保持精簡,好讓更多內容維護者與其社群能協調一致,要求 AI 開發者遵守。這最終將建立起一種網絡化的集體行動,以推動 AI 生態裡的互惠性。
CC Signals 的運作方式
誰在套用信號:
聲明方 (Declaring Party) 是決定收藏內容應如何被機器使用的人(或組織)。有時就該內容,聲明方擁有著作權,或有權代表權利人。在這些情況下,CC Signal(的表意) 在特定司法管轄區或可能具有法律效力。若收藏包括多位作者的內容,聲明方有責任在社群裡協調,以決定應適用何種信號才適當。
信號適用的機器用途之範圍:
聲明方會將 CC Signals 套用到一組標準分類中,從一般類別到特殊類別,例如:文字與資料探勘(Text and Data Mining, TDM)、AI 訓練(AI Training)、生成式 AI 訓練(Generative AI Training)、AI 推論(AI Inference)。為了將全球互通性最大化,這些類別不會由 Creative Commons 自行定義,而是依循 IETF(Internet Engineering Task Force,網際網路工程事務聯盟) 制定的國際標準。CC Signals 的框架會隨著標準類別定稿後而持續演進。所選定的類別,將界定本工具預計處理的活動範圍。
哪些信號被套用:
聲明方可從可用的 CC Signals 中進行選擇,表達其對機器採用(內容)的偏好。這代表聲明方表示依該特定信號元素的條款,該被選類別的機器採用是被允許的。(目前)提案中的四種組合是:
名譽標示
名譽標示 + 直接回饋
名譽標示 + 生態系回饋
名譽標示 + 保持開放
與 CC 授權相似,CC Signals 將同時具備 機器可解讀 與 人類可理解 的形式。其中,人類可理解的解釋——說明當某一信號被套用時會發生什麼——稱為 「聲明 (declaration)」。每一種信號都會有一份對應的聲明,並會依據「聲明方是否具有著作權權限」以及「所選定的機器採用範圍」而有所差異。至於套用 CC Signals 於資料集時所使用的程式碼字串,則稱為 「內容採用表述(content usage expression)」。
法律上的考量
CC Signals 被設計為全球性工具,這意味著它們運作於不同的法律制度中,而這些制度的運作方式並不一致。在機器採用的脈絡下,著作權法往往是有限的、不確定的,且在各司法管轄區之間缺乏一致性。因此,套用 CC Signals 可能會因「由誰套用」以及「在何種情境下套用」而產生不同的法律效果。
在著作權存在並適用的情況下,CC Signals 的目的在於衡平著作權的力量,但不擴張其權限。
這並不是在創造新的財產權,而更像是為機器律定行為規範。
更多細節請參閱完整報告。未來幾個月,我們將重點研究與分析 CC Signals 的法律涵義。
技術上的考量
CC Signals 的設計是建立在 IETF 正在制定的技術標準之上。我們已在 GitHub 上揭露 CC Signals 的技術考量與元件。
依循 CC Signals
名譽標示信號
在大型 AI 模型的脈絡下,出處標示與內容溯源是複雜、困難且隨技術發展快速演變的。然而,這並不意味著「名譽標示」的概念在 AI 環境下是無關緊要或不可能的。我們的目標是建立「可行的規範」,而不是讓「追求完美」阻礙進步。就像 CC 授權中的「姓名標示」條件,我們認為名譽標示的信號要素,可以採任何合理的方式來落實。我們計畫在未來階段制定名譽標示的指引與最佳實踐,並借鑑該領域其他人的進展。目前至少,我們預期這種信號至少要求採用者引註所使用的訓練資料集。至於能讓模型在回應查詢時檢索資訊的技術(例如檢索增強生成 RAG),以及其他技術上可行、能將內容連結至特定輸出的使用情境,這些輸出應提供連結以溯源該收藏內容。
直接回饋信號
這並非被設定為商業交易,而是旨在建立一種結構,讓財務或相類貢獻能支持聲明方的持續發展。套用 CC Signals 不應被視為一種商業模式,甚至不應被視為可靠的成本回收方式。這些回饋應與機器採用的類型與規模、以及採用者的財務能力成比例。與名譽標示類似,我們計畫隨著 CC Signals 的推進,制定直接回饋的指引與最佳實踐。
生態系回饋信號
這種信號旨在推動對整體共享資源(commons)的支持性回饋。雖然初期表述相當廣義且模糊,但我們希望並預期在不同領域與不同類型的採用情境下,會逐漸形成規範、最佳實踐,甚至新的集體導向結構。目標是鼓勵「回饋」的實踐,注入互惠性的規範,以幫助整個生態系統持續運作,造福所有人。
保持開放信號
這種信號元素反映出:讓 AI 模型保持開放——例如釋出模型權重、程式碼或資料集,讓他人使用與於其上建立基礎——是互惠性的一種型態。鑑於本領域已有其他人對「開放性」提供了有意義的定義,我們對此信號的提案也更具體,列出了遵循的具體要求。
為 AI 開發者的遵循提供激勵
我們理解,CC Signals 需要仰賴 AI 開發者的自願參與和遵循。雖然存在許多懷疑的理由,特別是當遵循或許不是法律義務時,而且永遠會有不良的行為者,但我們仍然有許多理由相信它會被廣泛採用。
首先,已有先例。雖然遵循(的表現)並非總是完美,但 robots.txt 多年來一直作為一種方式,用來將有關網路內容被機器採用的期望寫入規範性文件,並幫助維持這種社會契約。我們也看到 CC 授權的成功,證明了自願遵守是可能的。雖然 CC 授權建立在著作權法之上,因此(違反它)帶有侵權風險,但實際上它們之所以有效,是因為人們選擇遵守它們。涉及 CC 授權維護權利的訴訟相當罕見,多數案例與惡意行為有關。反之,如今在共享資源(commons)中已有數百億份 CC 授權作品,因為這些授權植基於人們對於「分享與知識再利用」的直觀公平與利他觀念。
此外,理性行為者也有充分理由去尊重並遵循偏好信號。正如我們在本報告前段所撰,來自整個公開網路的資料是發展大型 AI 模型的關鍵組成部分。若 AI 開發者不尊重創作者的意願,他們將削弱人們分享與廣泛散布作品的動機。隨著時間推移,這將損害所建構的模型與服務的準確性、安全性與時效性。對小型公司、新創公司、非營利組織與學術研究者而言,後果尤其嚴重,因為(這將導致)他們沒有資源而得轉而依賴所付不貲的授權交易。
請立即到 GitHub 分享你的反饋!