CNN 已向美國紐約南區聯邦法院(SDNY)對 AI 公司 Perplexity 提起著作權訴訟,指控其抓取超過 17,000 篇 CNN 報導並生成逐字複製內容,且繞過付費牆讓用戶取得訂閱內容。
(前情提要:亞馬遜禁止 Perplexity Comet「自動購物」法院核准禁令!AI 代理戰開打)
(背景補充:Google AI 搜尋上路後,你該怎麼重新規劃你的 SEO 策略)
過去幾年針對 AI 的著作權訴訟,幾乎都聚焦在同一個問題:用版權內容訓練模型,算不算侵權?CNN 在 5 月 28 日提告 AI 搜尋新創 Perplexity,問的則是另一件事,當 AI 每次回答用戶提問、即時爬取版權內容並生成摘要時,這個行為,是否構成侵權?
17,000 篇報導、付費牆、未具名爬蟲
CNN 在起訴書中列出一份相當具體的指控清單。Perplexity 的 AI 工具不只爬取 CNN 公開內容,更被指控抓取了超過 17,000 篇 CNN 報導、照片與影片,其中包括鎖在付費牆後面的訂閱內容,讓未付費的 Perplexity 用戶得以繞過 CNN 的訂閱門檻取得這些資料。
起訴書同時指控,Perplexity 使用的爬蟲刻意匿名,也就是以「未具名爬蟲」的方式運作,讓 CNN 難以識別並封鎖。即便 CNN 採取技術手段試圖阻擋,Perplexity 仍持續抓取。
CNN 的求償包含金錢賠償(若法院認定為「故意侵權」,賠償金額可能相當可觀)與永久禁制令。
其實 CNN 在 2025 年 10 月曾嘗試透過 Perplexity 的 Comet Plus 訂閱方案授權內容,但雙方無法就「Perplexity 在回答中使用 CNN 內容的限制」達成共識。CNN 在同年 11 月放棄協議,去函要求停止使用其內容與商標,Perplexity 據稱未回應。
這段談判記錄,在法律上具有重要意義:它使 CNN 得以主張 Perplexity 是在「明知未獲授權」的情況下繼續其行為。
法律新戰場:即時抓取,與訓練資料無關
要理解這宗訴訟為何在法律上是新的,須先釐清 AI 著作權訴訟目前的兩條戰線。
第一條是「訓練資料爭議」。這是大多數現有訴訟的核心,包括紐約時報控告 OpenAI,以及一群作者集體告 Anthropic 的案件。邏輯是:AI 公司用版權內容訓練語言模型,這個行為本身是否構成著作權侵害?Anthropic 已於去年成為首家達成和解的 AI 公司,同意支付 15 億美元了結相關集體訴訟。
第二條,也就是 CNN 這宗開創的戰線,針對的是「即時抓取做推論」。簡單來說就是,AI 搜尋工具在用戶每次提問的當下,即時去網路抓取版權內容、把它餵給語言模型,再生成含有逐字複製片段的回答。這個流程裡,不存在一個可以被稱為「訓練」的階段,它發生在推論時,也就是模型每次實際運作、回答問題的過程。
這兩者在法律上是否應受到相同對待,目前沒有確定答案。訓練資料案件的主要辯護策略之一是「轉化性使用」,也就是著作權法中的合理使用原則:如果對版權內容的使用方式具有足夠的轉化性,可能不構成侵權。
但逐字複製給用戶看,很難主張「轉化性」,CNN 的律師顯然看到了這個缺口。
Perplexity 發言人 Jesse Dwyer 的回應是:「You can’t copyright facts.(你無法為事實註冊著作權。)」這句話在邏輯上沒有錯,事實確實不受著作權保護。
但著作權保護的是表達,不是事實本身。如果 Perplexity 吐出的是 CNN 記者寫的逐字句子,而不是單純的事實陳述,那這個辯護能否成立,將由法院決定。
📍相關報導📍
Perplexity 全球下載量暴跌 80%:三大因素澆滅「AI 版 Google」增長神話
Google 新推兩種 AI 原生廣告:以 Gemini 重寫過去 30 年搜尋廣告規則
電信成 AI 普及入口!臺灣大與 Perplexity 合作,月租 599 元以上「免費享 1 年 Pro 會員」

