文/李汶龍
OpenAI在DeepSeek爆火之後指控其“只是蒸餾”引發了很強的民族熱情。實際上,模型蒸餾爭議並不新,早幾個月OpenAI停用位元組賬號訓練AI也基本上是相同原理。

可以想象,如果局面倒置,OpenAI的o1 mini蒸餾R1模型,指控美國公司侵權的指責也會層出不窮。OpenAI/Deepseek還涉及到不同國家的法律。如果OpenAI選擇追究——實際上Altman目前表示不走法律途徑——應該也不會傻到跑到中國來起訴。討論這個問題還需回到美國法語境。或許中短期內,模型蒸餾不會進入司法糾紛當中,但這個技術現象值得在法律視角下審視一番,至少確定其機理。
迴歸理性討論,知識蒸餾是一個有趣的現象,很多人嘗試透過技術視角或者類比加以理解,但很少有人在法律視角進行重構和分析。
著作權對於AI訓練而言最為重要,但是模型蒸餾的問題上貢獻很小。在AI生成內容是否可版權——即受到版權法保護——的問題上,美國版權局的幾個決定可見一斑。門檻設定還是相當高,目前甚至還未聽到成功案例,相當於關上了半扇門。即便可以證成某些內容受版權保護,版權問題接踵而至。其他AI廠商作為OpenAI的使用者,或者使用其賬戶,生成的內容,誰有權主張版權?目前尚且沒有任何真實的糾紛,理論上OpenAI作為AI廠商僅提供技術能力的立場很難在版權爭奪上佔據有利地位,這也就是為什麼Sam Altman當下選擇以技術而非法律進行對抗。版權法在模型蒸餾問題上基本處於休眠狀態。
模型蒸餾是否構成法律意義下的文字或資料探勘?這個問題將蒸餾引向版權法的合法例外,對於DeepSeek而言更為有利。關於文字/資料探勘,歐盟數字市場指令的構造更為清晰,但美國的合理使用理論更為宏觀且富有靈活性。在美國,討論AI語境下的合理使用的案子莫過於前幾天剛釋出的湯臣路透訴ROSS智慧。法官Bibas一改2023年的觀點,認為模型訓練本身不構成合理使用,但該案不涉及生成式人工智慧,因此結論未必能延展到模型蒸餾的討論。況且,如果可版權性和版權侵權尚且無法構成,也就沒有餘地討論合理使用。
有人會說,模型蒸餾違反了OpenAI的使用者協議,因此是合同侵權。這麼說沒錯,而且合同或許是目前來看最為明確和紮實的法律基礎。但是僅就合同侵權起訴,即便不考慮跨法域執行的難度,本身作為一項法律主張也不夠強。再考慮到執行,可能沒有企業願意去踏進這樣的糾紛。
關鍵的問題在於,除了使用者協議違規之外,模型廠商是否能夠得到更強的法律保護?
版權的延展性不足剛已述及,商標和專利的相關性就更低了。商標是用來區分商品/服務來源的標識,目標是防止市場上的混淆,並不涉及對演算法或模型的保護。專利雖然用於保護創新,但強調的是技術方案的獨特性和創新性;模型蒸餾更多的是最佳化模型的技術手段,重點在於提效和減少消耗,而不是新的技術發明,因此很難申請專利保護。
不正當競爭法看起來也相關,目前來看大部分情形下競爭法邏輯都會傾向於支援弱勢和新興一方。因此,反不正當競爭法可能會被挑戰者用來突破使用者協議的使用限制,而不會反過來支援大企業。換句話說,知識蒸餾的法律挑戰應該主要存在於保護商業利益的智慧財產權領域,而不是競爭或者其他。
此外還有一個關鍵領域未提,可能會打破局面提供超越合同之外的法律保護:商業秘密。
有人會問,AI產出的內容怎麼可能算秘密?
商業秘密的核心並不是指某項技術或工具本身,而是其獨特的實現方式、使用方法、最佳化過程和背後的積累知識。因此,AI生成內容的“秘密性”並不體現在AI工具的普遍可得性上,而在運用這些工具、如何設計模型以及如何最佳化這些模型來滿足特定的商業需求。
美國法語境中,構成商業秘密的要件有以下幾個方面

• 資訊的獨特性或秘密性——當然,在模型蒸餾的語境中,這裡的資訊並不是指模型產出的內容,而是企業透過研究和開發積累的演算法、資料和工藝等,例如在演算法資料、資料選擇和處理方式上的細節。如果這些技術細節是企業內部獨有未公開披露,那麼就符合商業秘密的“秘密性要求”。
• 商業價值——商業秘密必須對持有者具有實際經濟價值,尤其是在它未被公開時,這種價值來源於其秘密性和稀缺性。如果資訊公開,其他公司可以輕易複製或利用,商業價值大打折扣,商業秘密法的保護也就受限。模型蒸餾能夠提高計算效率、節約資源和降低部署成本,因此帶來顯著經濟利益。
• 採取合理保護措施保護該資訊不被洩露或者非法獲取,包括保密協議、限制訪問許可權、資料加密、物理或者數字手段隔離等。
• 商業資訊的濫用或者盜用,即非法獲取、使用或披露。
至少在理論上,OpenAI可以主張“知識蒸餾” 餾出了一些具有商業價值、可以直接用來市場競爭並被競爭者濫用的“秘密”。
然而,商業秘密法存在一個軟肋,即反向工程,而知識蒸餾可能成為一種反向工程的形式從而削弱商業秘密法的保護。反向工程即透過分析和研究已經獲得的產品、技術和資訊、逆向推匯出其背後的設計、演算法和工作原理,這一過程並不必然涉及非法獲取或侵犯秘密。美國法中,反向工程本身並不被視為是違法行為。尤其是以研究,或者以實現上下游產品相容和技術互操作性上,反向工程的合法性曾得到證成,即便被研究的產品或技術背後包含商業秘密。

進入到商業秘密法的深邃之處,需要對反向工程和非法獲取商業秘密之間做出一個區分。Reugters法學院的學者Camilla A. Hrdy2025年最新的一篇preprint就主張,在美國法語境下,反向工程即便是合法的,但模型蒸餾作為一種反向工程手段,可能會被認定為是“以不合理手段”開展而違反商業秘密法。Hrdy的觀點有二,即商業秘密法理論上可以作為提供合同外法律救濟的主要基礎,如果在使用者協議中明確限制反向工程,那麼會進一步增強在判定侵害商業秘密中的砝碼。

美國法下相關的判例是2024年的Compulife Software Inc. v. Newman。該案中,Compulife開發了一款用於保險定價的軟體。Newman曾是Compulife的客戶,透過逆向工程的方法成功複製了Compulife軟體的核心演算法。Newman在使用該軟體時,將其功能進行了修改和簡化,使之適用於不同的市場需求。美國法下,反向工程本身並不總是非法,但在這個案件中, Newman的行為涉及對受保護的商業秘密的非法使用,不符合“合法手段”獲取的要求。最終,法院認為Newman的行為屬於不正當手段,構成了商業秘密侵權。同理,知識蒸餾可以被看作是一種反向工程,但細究其獲得訓練“奧妙”的方式,可能也會受到非法手段的指責,尤其是在被蒸餾模型的使用者協議明禁止情況下。
因此,說到底,模型蒸餾的戰場多半會出現在商業秘密領域,並非此前很多人在爭論的版權。究竟是否有公司願意去承擔這樣的法律風險和成本,就得由時間來提供答案了。