AI一字不差背誦《哈利·波特》，居然不算盜版？地表最強法務迪士尼這次遇到對手了

過去幾個月，AI 圈一樁樁版權案接連爆出。

迪士尼拉著環球影業，把 Midjourney 告上法庭，指控它在沒打一聲招呼的情況下，就學會了畫《星球大戰》和《小黃人》。

圖片巨頭 Getty Images 則抓住了 Stability AI 的現行—— AI 不僅「吃」了它數百萬張帶版權的圖片，甚至在生成的新圖裡，還心虛地「吐」出了那個標誌性的水印，像個作案後忘了擦掉指紋的笨賊。

這些案子的起因都源於那個讓所有 AI 公司夜不能寐的問題：用來訓練模型的海量資料，究竟算不算「贓物」？

最近，兩場判決落槌，似乎給出了一個答案。Anthropic 和 Meta 在版權官司中都獲勝讓許多人以為警報已經解除。但細看之下，這場勝利並非這麼簡單——法官在判決書裡悄悄留下了一串解開謎題的鑰匙。

從表面上看，案情並不複雜。一群作家指控這兩家公司用他們寫的書來訓練大模型，這是偷竊。AI 公司則辯稱，這叫「變革性使用」，是學習，不是抄襲，屬於法律允許的「合理使用」。

出人意料的是，法官採納了 AI 公司的說法。他們認為，用書籍訓練 AI，和直接複製書籍來賣是兩碼事，確實有「變革性」，而且原告作家們也沒能拿出有力證據，證明自己的書因此就賣不出去了。

於是，判決落下，AI 公司贏了。至少，新聞標題是這麼寫的。

但就像所有精彩的故事一樣，真正的玄機藏在細節裡。法官的判詞，就像那個無意中為破案留下伏筆的警官，充滿了暗示。

在 Meta 的案子裡，Chhabria 法官幾乎是手把手地給原告「覆盤」。他毫不留情地指出，原告的訴訟策略簡直一團糟。「判決並不意味著Meta的行為就合法了，」他寫道，「只是因為這批原告沒能說服我。他們問錯了問題，也拿錯了證據。」

這番話，無異於在法庭上公開遞出了一份「訴訟指南」：這次算你們僥倖過關，下次來個更懂行的，結局就難說了。

另一邊，審理 Anthropic 案的 Alsup 法官，則對另一件事耿耿於懷：這些 AI 公司用來訓練的資料，很多是從盜版網站上扒下來的。「原罪」問題，讓他十分惱火。

「你們明明有合法渠道，卻偏要走捷徑，」他警告道，「用非法手段獲取的東西，別指望能用‘合理使用’這塊擋箭牌來洗白。」他甚至補充說，後來再去合法掃描，也抹不掉最初的「偷竊」行為。

這番話，等於在 AI 公司看似堅固的勝利堡壘上，預埋了一顆定時炸彈。今天的問題解決了，但歷史舊賬隨時可能被翻出來。

而真正致命的威脅，是那個被這兩場官司巧妙繞開的問題：AI「說」出來的話，算不算侵權？

訓練過程可以被解釋為「學習」，但如果 AI 能一字不差地「背誦」出《哈利·波特》呢？最近的一項研究就揭示了這個令人不安的事實：Meta 的模型記住了《哈利·波特與魔法石》超過 40% 的原文。AI 不再只是個學生，它成了一個藏著海量盜版書的行動硬碟。

該圖表顯示了讓模型從《哈利·波特與魔法石》各部分生成 50 個 token 的摘錄的難易程度，線越深，重現該部分內容就越容易

對此，Alsup 法官也早已劃下紅線：「如果 AI 的輸出內容直接抄襲了原作，那就是另一回事了。版權方完全可以拿著這些證據，再告一次，而且勝算會大得多。」

所以，這場勝利到底意味著什麼？

對於 Meta、OpenAI 這樣的巨頭來說，這或許只是爭取了更多的時間。他們財力雄厚，背後是頂尖的律師團隊，已經開始花錢與各大媒體和出版商簽署授權協議。對他們而言，版權問題正在從一個法律風險，轉變為一項可以計算的商業成本。

但對於那些規模較小、依賴開源資料的 AI 公司來說，警報遠未解除。他們沒有雄厚的資本去支付天價的授權費，也經不起漫長的官司消耗。一旦版權的「清算」全面開始，他們很可能就是第一批倒下的。

而對於創作者來說，局面則更加複雜。他們或許有機會透過授權獲得一些收入，但這筆錢，能否彌補一個被 AI 內容衝擊得七零八落的市場？

說到底，這兩場官司並沒有給出一個最終答案，反而讓問題變得更具體、更棘手了。這場圍繞版權的博弈，沒有因為幾次判決而結束，它只是從法庭上的唇槍舌劍，延伸到了談判桌前的真金白銀。

這場關於資料、創意與 AI 的博弈，或許才剛剛開始。

dignews.cc