CNN 控告 Perplexity 侵害著作權：1.7 萬篇報導逐字複製、繞過付費牆

CNN 已向美國紐約南區聯邦法院（SDNY）對 AI 公司 Perplexity 提起著作權訴訟，指控其抓取超過 17,000 篇 CNN 報導並生成逐字複製內容，且繞過付費牆讓用戶取得訂閱內容。
（前情提要：亞馬遜禁止 Perplexity Comet「自動購物」法院核准禁令！AI 代理戰開打）
（背景補充：Google AI 搜尋上路後，你該怎麼重新規劃你的 SEO 策略）

過去幾年針對 AI 的著作權訴訟，幾乎都聚焦在同一個問題：用版權內容訓練模型，算不算侵權？CNN 在 5 月 28 日提告 AI 搜尋新創 Perplexity，問的則是另一件事，當 AI 每次回答用戶提問、即時爬取版權內容並生成摘要時，這個行為，是否構成侵權？

17,000 篇報導、付費牆、未具名爬蟲

CNN 在起訴書中列出一份相當具體的指控清單。Perplexity 的 AI 工具不只爬取 CNN 公開內容，更被指控抓取了超過 17,000 篇 CNN 報導、照片與影片，其中包括鎖在付費牆後面的訂閱內容，讓未付費的 Perplexity 用戶得以繞過 CNN 的訂閱門檻取得這些資料。

起訴書同時指控，Perplexity 使用的爬蟲刻意匿名，也就是以「未具名爬蟲」的方式運作，讓 CNN 難以識別並封鎖。即便 CNN 採取技術手段試圖阻擋，Perplexity 仍持續抓取。

CNN 的求償包含金錢賠償（若法院認定為「故意侵權」，賠償金額可能相當可觀）與永久禁制令。

其實 CNN 在 2025 年 10 月曾嘗試透過 Perplexity 的 Comet Plus 訂閱方案授權內容，但雙方無法就「Perplexity 在回答中使用 CNN 內容的限制」達成共識。CNN 在同年 11 月放棄協議，去函要求停止使用其內容與商標，Perplexity 據稱未回應。

這段談判記錄，在法律上具有重要意義：它使 CNN 得以主張 Perplexity 是在「明知未獲授權」的情況下繼續其行為。

法律新戰場：即時抓取，與訓練資料無關

要理解這宗訴訟為何在法律上是新的，須先釐清 AI 著作權訴訟目前的兩條戰線。

第一條是「訓練資料爭議」。這是大多數現有訴訟的核心，包括紐約時報控告 OpenAI，以及一群作者集體告 Anthropic 的案件。邏輯是：AI 公司用版權內容訓練語言模型，這個行為本身是否構成著作權侵害？Anthropic 已於去年成為首家達成和解的 AI 公司，同意支付 15 億美元了結相關集體訴訟。

第二條，也就是 CNN 這宗開創的戰線，針對的是「即時抓取做推論」。簡單來說就是，AI 搜尋工具在用戶每次提問的當下，即時去網路抓取版權內容、把它餵給語言模型，再生成含有逐字複製片段的回答。這個流程裡，不存在一個可以被稱為「訓練」的階段，它發生在推論時，也就是模型每次實際運作、回答問題的過程。

這兩者在法律上是否應受到相同對待，目前沒有確定答案。訓練資料案件的主要辯護策略之一是「轉化性使用」，也就是著作權法中的合理使用原則：如果對版權內容的使用方式具有足夠的轉化性，可能不構成侵權。

但逐字複製給用戶看，很難主張「轉化性」，CNN 的律師顯然看到了這個缺口。

Perplexity 發言人 Jesse Dwyer 的回應是：「You can’t copyright facts.（你無法為事實註冊著作權。）」這句話在邏輯上沒有錯，事實確實不受著作權保護。

但著作權保護的是表達，不是事實本身。如果 Perplexity 吐出的是 CNN 記者寫的逐字句子，而不是單純的事實陳述，那這個辯護能否成立，將由法院決定。