核心閱讀
近日中國(guó)人民大學(xué)國(guó)家版權(quán)貿(mào)易基地發(fā)布的“2024數(shù)字版權(quán)保護(hù)與發(fā)展年度關(guān)鍵詞”中,“AI大模型語(yǔ)料訓(xùn)練版權(quán)挑戰(zhàn)”位列八大關(guān)鍵詞中的第三位。在保護(hù)好創(chuàng)作者權(quán)益、激發(fā)創(chuàng)作熱情與推動(dòng)產(chǎn)業(yè)創(chuàng)新中尋求平衡,已是當(dāng)前必須面對(duì)的重大課題。
全球人工智能技術(shù)快速更迭,以ChatGPT為代表的生成式人工智能技術(shù)正在改變世界,版權(quán)是其中受影響最為明顯的。
人工智能并不能“無(wú)中生有”,海量互聯(lián)網(wǎng)信息是其培養(yǎng)沃土。這就意味著,其必然陷入關(guān)于知識(shí)產(chǎn)權(quán)與內(nèi)容剽竊的爭(zhēng)議。近年來,內(nèi)容版權(quán)與人工智能的沖突頻頻發(fā)生。
在剛剛過去的2024年,國(guó)內(nèi)外均有頗具影響力與關(guān)注度的相關(guān)案例發(fā)生。近日中國(guó)人民大學(xué)國(guó)家版權(quán)貿(mào)易基地發(fā)布的“2024數(shù)字版權(quán)保護(hù)與發(fā)展年度關(guān)鍵詞”中,“AI大模型語(yǔ)料訓(xùn)練版權(quán)挑戰(zhàn)”位列八大關(guān)鍵詞中的第三位。
在保護(hù)好創(chuàng)作者權(quán)益、激發(fā)創(chuàng)作熱情與推動(dòng)產(chǎn)業(yè)創(chuàng)新中尋求平衡,已是當(dāng)前必須面對(duì)的重大課題。
版權(quán)保護(hù)面臨挑戰(zhàn)
近年來,大模型的發(fā)展一浪高過一浪,呈洶涌澎湃之勢(shì)。
放眼全球,除ChatGPT外,Midjourney、Stable Diffusion、Sora等AI大模型風(fēng)靡一時(shí),人工智能產(chǎn)業(yè)在科技發(fā)達(dá)國(guó)家迅猛發(fā)展。國(guó)內(nèi)也不遜色,多個(gè)互聯(lián)網(wǎng)公司紛紛入局,推出文心一言、通義千問、豆包等人工智能大模型。
這些產(chǎn)品的出現(xiàn),帶來的便利性顯而易見,它們讓文案寫作、信息檢索、數(shù)據(jù)處理等變得更加高效,深刻影響著傳統(tǒng)行業(yè)秩序與工作習(xí)慣。
曉飛是一家公司的文職人員,她告訴《法治日?qǐng)?bào)》記者,她現(xiàn)在有什么疑難問題經(jīng)常會(huì)求助于上述有關(guān)產(chǎn)品,“尤其是要準(zhǔn)備一些格式化的文字材料時(shí),把要求盡可能詳細(xì)地說給它們聽,一般都會(huì)呈現(xiàn)符合要求的內(nèi)容,省去了我過去搜集材料、了解相關(guān)背景知識(shí)的大量時(shí)間”。
復(fù)旦大學(xué)管理學(xué)院信息管理與商業(yè)智能系教授盧向華也是大模型的積極應(yīng)用者。在盧向華看來,對(duì)于大模型的應(yīng)用,與過去相比,至少可以節(jié)省70%的精力。
人工智能大模型在受到歡迎的同時(shí),也引發(fā)爭(zhēng)議。例如,2024年,某網(wǎng)絡(luò)小說平臺(tái)通知簽約作者,要求簽署一份補(bǔ)充協(xié)議,允許將他們的簽約作品用于AI模型訓(xùn)練,引發(fā)反對(duì)聲音,后又刪除了該條款。但有關(guān)質(zhì)疑并未就此消失。有作者明確表示擔(dān)憂,“會(huì)因此失去對(duì)作品的控制權(quán)”,或是“沒有發(fā)表的素材被AI吸收后率先輸出相似內(nèi)容,反倒讓自己成為‘剽竊侵權(quán)者’”。
音樂領(lǐng)域也同樣有著類似的擔(dān)憂?;仡欉^去這一年,不少創(chuàng)作者開始熟練用起AI工具制作音樂內(nèi)容,只要輸入音樂風(fēng)格、流派等簡(jiǎn)單文本提示,幾秒鐘后就能得到一首完整的曲子。
在近日中國(guó)人民大學(xué)國(guó)家版權(quán)貿(mào)易基地舉辦的2024數(shù)字版權(quán)保護(hù)與發(fā)展論壇上,中宣部版權(quán)管理局原副局長(zhǎng)段玉萍坦言,新技術(shù)確實(shí)給音樂版權(quán)保護(hù)帶來新挑戰(zhàn),并特別提及了AI孫燕姿引發(fā)版權(quán)爭(zhēng)議的例子。
“在人工智能等新技術(shù)的推動(dòng)下,作品的范圍日益擴(kuò)充,版權(quán)的界限逐漸模糊,傳統(tǒng)的版權(quán)保護(hù)方式越來越難以應(yīng)對(duì)新技術(shù)、新業(yè)態(tài)、新模式的挑戰(zhàn)?!敝袊?guó)人民大學(xué)黨委常委、副校長(zhǎng)支曉強(qiáng)說。
訴訟案例涉多領(lǐng)域
內(nèi)容版權(quán)與人工智能的沖突,并不總以“論戰(zhàn)”的形式呈現(xiàn),訴諸公堂的也有多個(gè)案例。
中國(guó)人民大學(xué)國(guó)家版權(quán)貿(mào)易基地副主任李方麗告訴記者,國(guó)內(nèi)外均有相關(guān)司法實(shí)踐。就國(guó)外而言,自《紐約時(shí)報(bào)》訴OpenAI和微軟大模型訓(xùn)練侵權(quán)后,出現(xiàn)了多起針對(duì)AI大模型訓(xùn)練數(shù)據(jù)的訴訟。
記者查詢到,2023年12月27日,《紐約時(shí)報(bào)》宣布,向紐約南區(qū)聯(lián)邦法院提起訴訟,指控微軟及OpenAI侵犯版權(quán),濫用該媒體的知識(shí)產(chǎn)權(quán)。隨后,美國(guó)3家數(shù)字新聞媒體The Intercept、Raw Story和AlterNet于2024年2月28日對(duì)OpenAI提起版權(quán)侵權(quán)訴訟。
2024年6月,人工智能初創(chuàng)公司Perplexity相繼遭到《福布斯》以及科技媒體《連線》的內(nèi)容剽竊指控,聲稱在Perplexity的Pages工具中發(fā)現(xiàn)了他們的報(bào)道內(nèi)容。10月21日,媒體大亨魯珀特·默多克旗下新聞集團(tuán)的子公司道瓊斯和《紐約郵報(bào)》對(duì)Perplexity提起訴訟,稱其“大量非法復(fù)制”他們的版權(quán)作品。
音樂領(lǐng)域也不消停。2024年6月,美國(guó)唱片業(yè)協(xié)會(huì)起訴了兩家AI音樂公司——Suno和Udio,指控他們?cè)谟?xùn)練AI工具時(shí),涉嫌侵犯音樂版權(quán)。
此外,在加拿大、德國(guó)等也有類似的案例。中國(guó)人民大學(xué)法學(xué)院教授金海軍說,他統(tǒng)計(jì)了類似的訴訟,大概有十幾起,文字、圖片、音樂等各個(gè)領(lǐng)域的著作權(quán)作品都受到這個(gè)問題困擾。
國(guó)內(nèi)也已有相關(guān)案例。2024年2月8日,廣州互聯(lián)網(wǎng)法院作出全球首例生成式人工智能平臺(tái)侵權(quán)責(zé)任判決,認(rèn)定被告某AI公司侵犯了原告對(duì)奧特曼作品的復(fù)制權(quán)和改編權(quán)。
同年4月23日,全國(guó)首例AI生成聲音人格權(quán)侵權(quán)案,在北京互聯(lián)網(wǎng)法院判決配音師勝訴,AI開發(fā)者使用配音師聲音、開發(fā)涉案AI文本轉(zhuǎn)語(yǔ)音產(chǎn)品未獲得合法授權(quán),構(gòu)成侵權(quán)。
同年6月20日,北京互聯(lián)網(wǎng)法院在線開庭審理了四起畫師起訴AI繪畫軟件開發(fā)運(yùn)營(yíng)者著作權(quán)侵權(quán)案件,該案為全國(guó)首例涉AI繪畫大模型訓(xùn)練著作權(quán)侵權(quán)案。
商業(yè)使用尤為復(fù)雜
目前,我國(guó)著作權(quán)法在AI生成物保護(hù)方面暫無(wú)明確規(guī)定;AI生成內(nèi)容的著作權(quán)歸屬于AI技術(shù)的開發(fā)者還是實(shí)際使用者尚存在爭(zhēng)議,有待法律和政策層面的明確指引。
民間正在積極行動(dòng)。2024年12月4日,中國(guó)文字著作權(quán)協(xié)會(huì)倡議:生成式人工智能語(yǔ)料庫(kù)建設(shè)等應(yīng)確保數(shù)據(jù)來源合法,人工智能技術(shù)的發(fā)展既要保護(hù)創(chuàng)作者、內(nèi)容生產(chǎn)者合法權(quán)益,又要激發(fā)全社會(huì)創(chuàng)新創(chuàng)造活力,推動(dòng)產(chǎn)業(yè)高質(zhì)量發(fā)展。
當(dāng)?shù)貢r(shí)間2024年12月16日,“人工智能創(chuàng)意權(quán)利聯(lián)盟”在英國(guó)正式成立,提出了有關(guān)版權(quán)與生成式人工智能政策的三項(xiàng)關(guān)鍵原則,并呼吁英國(guó)政府將這三項(xiàng)原則作為制定人工智能政策的框架。
“上述大模型都需要有足夠的語(yǔ)料去訓(xùn)練AI模型,而訓(xùn)練過程中,必然要使用到大量含有版權(quán)的作品。這就涉及我們?nèi)绾问褂米髌?,或者說如何合理使用作品等問題?!崩罘禁愓f。
金海軍認(rèn)為,在健全相關(guān)制度方面,要特別關(guān)注AI生成內(nèi)容產(chǎn)生過程中的兩個(gè)部分。一是產(chǎn)出的階段,即AI生成的內(nèi)容到底能不能受著作權(quán)保護(hù),即所謂的作品問題和作者資格問題;二是在輸入階段,在使用語(yǔ)料的時(shí)候,如果涉及享有著作權(quán)的作品,是否構(gòu)成侵權(quán)。如果構(gòu)成侵權(quán)的話,能否以合理使用來抗辯。
“從國(guó)際上目前的情況來看,在認(rèn)定是否構(gòu)成著作權(quán)法意義上的作品這一問題上,整體上是比較嚴(yán)格的。在輸入端使用作品的時(shí)候,相對(duì)來講要求比較寬松。但是有一個(gè)條件,在文本挖掘和數(shù)據(jù)訓(xùn)練使用的時(shí)候是非商業(yè)性的。一旦進(jìn)入商業(yè)系統(tǒng),恐怕也不能夠簡(jiǎn)單地說,這就是侵權(quán)或者構(gòu)成合理使用?!苯鸷\娬f。
中國(guó)版權(quán)協(xié)會(huì)理事長(zhǎng)閻曉宏認(rèn)為,從技術(shù)角度來看,使用有版權(quán)的作品,在技術(shù)條件許可的情況下要公布相關(guān)信息,“讓人家知道你使用了什么”。原則上應(yīng)該認(rèn)為,這些使用是可行的,作品一一得到許可,事實(shí)上是做不到的。應(yīng)當(dāng)按照2022年12月印發(fā)的《中共中央 國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》中的“淡化所有權(quán)、強(qiáng)化使用權(quán)”為指導(dǎo),加快立法,明確使用原則,如果涉及商業(yè)使用,則需要支付報(bào)酬,如何支付報(bào)酬,應(yīng)當(dāng)在國(guó)家版權(quán)局的指導(dǎo)下,由使用者和權(quán)利人組織協(xié)商解決。
在此前召開的中歐數(shù)字環(huán)境下版權(quán)保護(hù)研討會(huì)上,中國(guó)國(guó)家版權(quán)局有關(guān)負(fù)責(zé)人指出,中國(guó)以積極的、前瞻性的思維迎接人工智能的到來,研究和監(jiān)管人工智能,完善制度設(shè)計(jì),探索規(guī)范人工智能相關(guān)版權(quán)規(guī)則,加強(qiáng)對(duì)人工智能生成內(nèi)容傳播的監(jiān)測(cè)。
(責(zé)任編輯:王擎宇)