Anthropic 被控使用 700 萬本盜版書訓練模型,遭遇作家集體訴訟,最高恐遭逾兆美元賠償,牽動整個 AI 產業的數據合規與投資評價。
(前情提要:AI隱私崩盤「ChatGPT對話」在法律前裸奔;Altman:我害怕輸入個資、難知道誰會拿到資料 )
(背景補充:AI能翻案?無律師女靠ChatGPT挖500萬遺產詐騙、說服法院重啟調查
一
起關乎 700 萬本書籍的版權訴訟,正把推出熱門 AI 模型 Claude 的母公司 Anthropic 推上聚光燈,作家團體七月下旬正式控告 Anthropic 盜用大量受版權保護的書籍訓練大型語言模型,若最終敗訴,Anthropic 恐付出天價賠償金。
法官裁定:訓練行為可算合理使用,但數據來源不行
根據《Fortune》報導,聯邦法官 William Alsup 認定,若 AI 公司「合法取得」書籍,再將內容轉化為參數,用於模型訓練,可構成合理使用;然而,一旦資料是從 LibGen、PiLiMi 這類影子圖書館非法下載,情況立即翻轉,訓練成果不能被豁免。
此番劃線,使 Anthropic 雖在模型開發方式獲得部分支持,卻須為數據來源獨立受審。
賠償試算:最高上看 1 兆美元的生存考驗
美國版權法規定,每件侵權作品法定賠償金 750 至 15 萬美元不等;若陪審團認定行為屬「故意」,將套用最上限。法律學者 Ed Lee 援引此標準推算,假設有 600 萬本書遭侵權,Anthropic 最嚴重可能面臨 1.05 兆美元賠償。
相較公司約 40 億美元年收入與 600 億至 1,000 億美元估值,這不但是天文數字,更直接威脅營運存續。
法律分歧與產業連鎖反應
值得注意的是,同在北加州聯邦法院的法官 Vince Chhabria,在另一件涉及 Meta 的資料訴訟中,曾表示 AI 訓練具「轉化性目的」即可涵蓋未經授權的下載,引發與 Alsup 截然不同的司法觀點。
據了解,Anthropic 案將於 12 月 1 日開庭,結果不論是判決或和解,都將成為日後衡量數據來源是否合法的範本,同時影響正面臨相似爭議的 OpenAI 等業者。
可能的結果推算
川普政府為維持美國在 AI 領域的競爭力,可能會傾向放寬合理使用範圍;然而,就算法院採折衷路線,以數十億美元和解收場,也足以逼使整個產業重新檢視資料供應鏈。
對資本市場而言,評估 AI 公司的長期價值,已不能只看演算法突破或參數規模,還要把數據合法性、潛在訴訟成本與和解準備金納入模型。能夠提供乾淨授權內容的出版商與資料平台,反而可能在新秩序下擁有更高議價權。
Anthropic 版權訴訟不單是一宗企業糾紛,更像照妖鏡,映出創新與智慧財產權之間的緊張平衡。未來能站穩腳步的 AI 公司,除了技術領先,還得遵守日益嚴格的數據治理紅線。