AI一字不差背誦《哈利·波特》,居然不算盜版?地表最強法務迪士尼這次遇到對手了

過去幾個月,AI 圈一樁樁版權案接連爆出。
迪士尼拉著環球影業,把 Midjourney 告上法庭,指控它在沒打一聲招呼的情況下,就學會了畫《星球大戰》和《小黃人》。
圖片巨頭 Getty Images 則抓住了 Stability AI 的現行—— AI 不僅「吃」了它數百萬張帶版權的圖片,甚至在生成的新圖裡,還心虛地「吐」出了那個標誌性的水印,像個作案後忘了擦掉指紋的笨賊。
這些案子的起因都源於那個讓所有 AI 公司夜不能寐的問題:用來訓練模型的海量資料,究竟算不算「贓物」?
最近,兩場判決落槌,似乎給出了一個答案。Anthropic 和 Meta 在版權官司中都獲勝讓許多人以為警報已經解除。但細看之下,這場勝利並非這麼簡單——法官在判決書裡悄悄留下了一串解開謎題的鑰匙。
從表面上看,案情並不複雜。一群作家指控這兩家公司用他們寫的書來訓練大模型,這是偷竊。AI 公司則辯稱,這叫「變革性使用」,是學習,不是抄襲,屬於法律允許的「合理使用」。
出人意料的是,法官採納了 AI 公司的說法。他們認為,用書籍訓練 AI,和直接複製書籍來賣是兩碼事,確實有「變革性」,而且原告作家們也沒能拿出有力證據,證明自己的書因此就賣不出去了。
於是,判決落下,AI 公司贏了。至少,新聞標題是這麼寫的。
但就像所有精彩的故事一樣,真正的玄機藏在細節裡。法官的判詞,就像那個無意中為破案留下伏筆的警官,充滿了暗示。
在 Meta 的案子裡,Chhabria 法官幾乎是手把手地給原告「覆盤」。他毫不留情地指出,原告的訴訟策略簡直一團糟。「判決並不意味著Meta的行為就合法了,」他寫道,「只是因為這批原告沒能說服我。他們問錯了問題,也拿錯了證據。」
這番話,無異於在法庭上公開遞出了一份「訴訟指南」:這次算你們僥倖過關,下次來個更懂行的,結局就難說了。
另一邊,審理 Anthropic 案的 Alsup 法官,則對另一件事耿耿於懷:這些 AI 公司用來訓練的資料,很多是從盜版網站上扒下來的。「原罪」問題,讓他十分惱火。
「你們明明有合法渠道,卻偏要走捷徑,」他警告道,「用非法手段獲取的東西,別指望能用‘合理使用’這塊擋箭牌來洗白。」他甚至補充說,後來再去合法掃描,也抹不掉最初的「偷竊」行為。
這番話,等於在 AI 公司看似堅固的勝利堡壘上,預埋了一顆定時炸彈。今天的問題解決了,但歷史舊賬隨時可能被翻出來。
而真正致命的威脅,是那個被這兩場官司巧妙繞開的問題:AI「說」出來的話,算不算侵權?
訓練過程可以被解釋為「學習」,但如果 AI 能一字不差地「背誦」出《哈利·波特》呢?最近的一項研究就揭示了這個令人不安的事實:Meta 的模型記住了《哈利·波特與魔法石》超過 40% 的原文。AI 不再只是個學生,它成了一個藏著海量盜版書的行動硬碟。
該圖表顯示了讓模型從《哈利·波特與魔法石》各部分生成 50 個 token 的摘錄的難易程度,線越深,重現該部分內容就越容易
對此,Alsup 法官也早已劃下紅線:如果 AI 的輸出內容直接抄襲了原作,那就是另一回事了。版權方完全可以拿著這些證據,再告一次,而且勝算會大得多。」
所以,這場勝利到底意味著什麼?
對於 Meta、OpenAI 這樣的巨頭來說,這或許只是爭取了更多的時間。他們財力雄厚,背後是頂尖的律師團隊,已經開始花錢與各大媒體和出版商簽署授權協議。對他們而言,版權問題正在從一個法律風險,轉變為一項可以計算的商業成本。
但對於那些規模較小、依賴開源資料的 AI 公司來說,警報遠未解除。他們沒有雄厚的資本去支付天價的授權費,也經不起漫長的官司消耗。一旦版權的「清算」全面開始,他們很可能就是第一批倒下的。
而對於創作者來說,局面則更加複雜。他們或許有機會透過授權獲得一些收入,但這筆錢,能否彌補一個被 AI 內容衝擊得七零八落的市場?
說到底,這兩場官司並沒有給出一個最終答案,反而讓問題變得更具體、更棘手了。這場圍繞版權的博弈,沒有因為幾次判決而結束,它只是從法庭上的唇槍舌劍,延伸到了談判桌前的真金白銀。
這場關於資料、創意與 AI 的博弈,或許才剛剛開始。

我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)
更多崗位資訊請點選這裡🔗


相關文章