觀點文章呈現多元意見,不代表《WEB3+》的立場
AI時代的版權新挑戰:用AI創作會侵權嗎?
在數位創意領域,人工智慧(AI)及其在生成型AI上的應用已經開啟了一個新時代,挑戰著傳統的著作權法界限。
與一般認知相反,AI的機器學習過程並不類似於侵權人典型的重製或模仿;相反的,AI的機器學習更像人類學習的過程,是透過對作品的接觸,去學習色彩、語言及圖案排列的邏輯跟呈現順序,進而憑藉學習成果產出全新、不具與學習素材實質相近的著作。
本文旨在深入探討AI機器學習的複雜性,並同時闡明其法律含義,並透過引述近期的重要案例來糾正常見的誤解。
AI如何生成圖片、文字?
生成型AI的基本原理是透過對資料、數據的學習來創造新內容。與著作權侵害典型的態樣「散布」、「重製」及「改作」不同,它更多地是從現存著作及數據中進行「學習」。
圖像生成
1. 數據分析與模式學習: 用於圖像創作的生成型AI,首先透過分析大量圖像數據開始。
這包括識別圖像中的物體,還要理解筆觸紋理、色彩漸變、光照及空間關係等更深層次的元素。舉例而言,一個成熟的生成是AI在學習風景畫時,會於識別不同的元素後,如筆觸、色彩混合技術以及光影的交互作用,應用這些元素於產出之作品中。
2. 特徵提取: AI演算法中的卷積神經網路(convolutional neural network),可以藉由圖像作品特定特徵之提取,進而達到識別、並分離圖像各種特徵,如邊緣、形狀和紋理之效果。而「特徵提取」對於AI機器人理解不同藝術作品之風格、筆觸及畫技至關重要。
3. 全新作品之生成: 一旦AI透過特徵提取、數據分析學會了特定技巧及藝術風格,它就可以生成新圖像。
這通常是使用生成對抗網絡(Generative Adversarial Network,GANs)來完成的。GANs包括圖像生成器及圖像鑑別器,透過生成器及鑑別器之交互作用及迭代之過程,生成式AI最終會製作出風格、特徵上接近訓練數據之圖像(通常是指控侵權著作),但在實際比對卻與訓練數據之圖像無實質近似性。
文本生成
1. 數據獲取與語言模型建立: 對於文本生成,像ChatGPT這樣的AI模型吸收大量文本數據,包括但不限於書籍、文章、網站內容,甚至是對話紀錄等廣泛來源。AI藉由文本數據構建出一個能理解語法和推論出上下文的語言模型。
2. 語言預測: 文本生成式AI中,最普遍的語言預測模型是n-gram,它會計算「特定詞或短語」後接續詞語的概率,進而達到慣用語表達、敘事結構和主、受詞之一致之目的。然而,語言預測模型n-gram常見於文法、拼寫檢查,但難以處理較複雜的文本生成。
3. 編碼及文本理解: 對於上下文延伸以及整篇文本生成之複雜任務,n-gram模型就顯得力不從心,這是因為它只能從有限的上下文信息進行預測,而非理解文本之語意。
相反地,Transformer模型透過自注意力機制(Self-Attention)將文本中的文字轉換成向量(Input Embedding),再透過位置編碼(Positional Encoding)加入文字順序信息,來達到整份文本脈絡之全面理解。
4. 文本生成: 透過編碼器(Encoder)對文本進行深度理解後,解碼器(Decoder)則負責根據學到的文本特徵進行文本生成。
這過程中,即使文字間長距離依賴關係可以被有效捕捉。上述Transformer模型的特性,讓它得以生成前後連貫,而且具有創造性的文本。這種生成過程不僅基於對原文本深層次語意的理解,而且能夠在深度學習後創造出在文義上符合邏輯、在內容上具備原創性的文本。。
AI生成與版權侵犯差在哪?
從前述圖片及文本生成的原理可以知道,AI生成內容的方式與著作權法裡所規定的侵權態樣大相徑庭,從以下幾點觀察尤其明顯:
1. AI中的創造性本質: 生成型AI顯然不是不簡單地將其學習的資料(現有作品)進行「複製」或「再現」。
反之,它是從大量數據及資料中學習文本的底層邏輯、文章結構及風格,綜合這些元素後,來創造具備新穎信的著作。例如,在圖像生成中,儘管AI可能從現有的藝術作品中學習,但產生的最終圖像絕對不是複製自認和現存的著作,而是將深層學習的成果進行重組、轉譯而生的新創作。
2. 法律解釋: 從法律角度來看,AI生成內容與人類複製之間的區別是顯著的。著作權法的基礎概念是「僅保護想法之表達,而非想法、觀念或系統本身」。
由上述可知,AI生成的作品是從訓練數據(原作品)中學習底層邏輯、文章結構、圖像作品之作畫風格、筆觸等想法及觀念,而絕對不是去「再現」或「重置」訓練數據(原作品)之表達。
AI生成作品的方式顯然挑戰傳統著作權侵犯的界限。像「Andersen v. Stability AI Ltd」此代表性的案例中,訴訟上法律的攻防重點就是在Stable Diffusion生成之圖片不構成侵權之情況下,它使用受版權保護的圖像來訓練AI是否構成侵權。
3. 轉化與合理使用: 從AI生成之作品來討論是否構成侵權,則會去討論到生成作品具備足夠之轉化性——這代表生成式AI在原作的基礎上增添額外的表達,甚至賦予新的意義,這時候就要討論是否有構成「合理使用」之可能。
這取決於AI創造出與原作顯著不同作品的能力。目前DALL-E就是為了比免這樣的法律爭端,所以全面禁止以提供以AI在原作品上進行改作的功能。
利用AI對現存著作進行改作的爭議再進起打到高峰,近期風靡全球的「帕魯世界」,就是利用生成式AI,將多隻寶可夢進行改作,甚至是多隻寶可夢的融合。針對文本生成上,Thomson Reuters v. Ross Intelligence案之審查中,雙方對於AI所生成的法律問件事構成合理使用的爭點有深入的討論,並做出肯定「合理使用」之結論。
生成式AI,對著作權法有哪些影響?
AI生成內容的過程,在圖像和文本背景下展示了一種與直接複製或再生不同的創造性形式。這種區別對於理解為何AI的學習和生成方法不同於著作權侵犯之態樣至關重要。
隨著AI的不斷發展,現存著作權隻法律解,釋必須有相應地修正及發展。隨著AI技術的持續推廣和更新,著作權法所面對的創作太樣正處於不斷變化之中。
「AI的學習、生成模式」與「著作權之重置態樣」、「人類對想法、觀念學習」之區別不僅僅在定義上大相逕庭,也同時涉及深遠的立法邏輯和創作倫理之解讀。
隨著AI技術的進步,現存的法律框架並定會進行修正;然而,相應法律修正的方向,有賴於立法者要如何平衡「AI創新潛力」與「保護原創作品與」這兩個價值。
因此,下次當您遇到生成式AI是否構成著作權侵害的辯論時,請記得這是兩個價值的折衝,絕對不要基於過時的觀念草率地做出「生成式AI侵害原作著作權」的結論。