近日中國人民大學國家版權(quán)貿(mào)易基地發(fā)布的“2024數(shù)字版權(quán)保護與發(fā)展年度關(guān)鍵詞”中,“AI大模型語料訓練版權(quán)挑戰(zhàn)”位列八大關(guān)鍵詞中的第三位。在保護好創(chuàng)作者權(quán)益、激發(fā)創(chuàng)作熱情與推動產(chǎn)業(yè)創(chuàng)新中尋求平衡,已是當前必須面對的重大課題。

  法治日報記者 張維

  全球人工智能技術(shù)快速更迭,以ChatGPT為代表的生成式人工智能技術(shù)正在改變世界,版權(quán)是其中受影響最為明顯的。

  人工智能并不能“無中生有”,海量互聯(lián)網(wǎng)信息是其培養(yǎng)沃土。這就意味著,其必然陷入關(guān)于知識產(chǎn)權(quán)與內(nèi)容剽竊的爭議。近年來,內(nèi)容版權(quán)與人工智能的沖突頻頻發(fā)生。

  在剛剛過去的2024年,國內(nèi)外均有頗具影響力與關(guān)注度的相關(guān)案例發(fā)生。近日中國人民大學國家版權(quán)貿(mào)易基地發(fā)布的“2024數(shù)字版權(quán)保護與發(fā)展年度關(guān)鍵詞”中,“AI大模型語料訓練版權(quán)挑戰(zhàn)”位列八大關(guān)鍵詞中的第三位。

  在保護好創(chuàng)作者權(quán)益、激發(fā)創(chuàng)作熱情與推動產(chǎn)業(yè)創(chuàng)新中尋求平衡,已是當前必須面對的重大課題。

  版權(quán)保護面臨挑戰(zhàn)

  近年來,大模型的發(fā)展一浪高過一浪,呈洶涌澎湃之勢。

  放眼全球,除ChatGPT外,Midjourney、Stable Diffusion、Sora等AI大模型風靡一時,人工智能產(chǎn)業(yè)在科技發(fā)達國家迅猛發(fā)展。國內(nèi)也不遜色,多個互聯(lián)網(wǎng)公司紛紛入局,推出文心一言、通義千問、豆包等人工智能大模型。

  這些產(chǎn)品的出現(xiàn),帶來的便利性顯而易見,它們讓文案寫作、信息檢索、數(shù)據(jù)處理等變得更加高效,深刻影響著傳統(tǒng)行業(yè)秩序與工作習慣。

  曉飛是一家公司的文職人員,她告訴《法治日報》記者,她現(xiàn)在有什么疑難問題經(jīng)常會求助于上述有關(guān)產(chǎn)品,“尤其是要準備一些格式化的文字材料時,把要求盡可能詳細地說給它們聽,一般都會呈現(xiàn)符合要求的內(nèi)容,省去了我過去搜集材料、了解相關(guān)背景知識的大量時間”。

  復旦大學管理學院信息管理與商業(yè)智能系教授盧向華也是大模型的積極應用者。在盧向華看來,對于大模型的應用,與過去相比,至少可以節(jié)省70%的精力。

  人工智能大模型在受到歡迎的同時,也引發(fā)爭議。例如,2024年,某網(wǎng)絡(luò)小說平臺通知簽約作者,要求簽署一份補充協(xié)議,允許將他們的簽約作品用于AI模型訓練,引發(fā)反對聲音,后又刪除了該條款。但有關(guān)質(zhì)疑并未就此消失。有作者明確表示擔憂,“會因此失去對作品的控制權(quán)”,或是“沒有發(fā)表的素材被AI吸收后率先輸出相似內(nèi)容,反倒讓自己成為“剽竊侵權(quán)者””。

  音樂領(lǐng)域也同樣有著類似的擔憂。回顧過去這一年,不少創(chuàng)作者開始熟練用起AI工具制作音樂內(nèi)容,只要輸入音樂風格、流派等簡單文本提示,幾秒鐘后就能得到一首完整的曲子。

  在近日中國人民大學國家版權(quán)貿(mào)易基地舉辦的2024數(shù)字版權(quán)保護與發(fā)展論壇上,中宣部版權(quán)管理局原副局長段玉萍坦言,新技術(shù)確實給音樂版權(quán)保護帶來新挑戰(zhàn),并特別提及了AI孫燕姿引發(fā)版權(quán)爭議的例子。

  “在人工智能等新技術(shù)的推動下,作品的范圍日益擴充,版權(quán)的界限逐漸模糊,傳統(tǒng)的版權(quán)保護方式越來越難以應對新技術(shù)、新業(yè)態(tài)、新模式的挑戰(zhàn)。”中國人民大學黨委常委、副校長支曉強說。

  訴訟案例涉多領(lǐng)域

  內(nèi)容版權(quán)與人工智能的沖突,并不總以“論戰(zhàn)”的形式呈現(xiàn),訴諸公堂的也有多個案例。

  中國人民大學國家版權(quán)貿(mào)易基地副主任李方麗告訴記者,國內(nèi)外均有相關(guān)司法實踐。就國外而言,自《紐約時報》訴OpenAI和微軟大模型訓練侵權(quán)后,出現(xiàn)了多起針對AI大模型訓練數(shù)據(jù)的訴訟。

  記者查詢到,2023年12月27日,《紐約時報》宣布,向紐約南區(qū)聯(lián)邦法院提起訴訟,指控微軟及OpenAI侵犯版權(quán),濫用該媒體的知識產(chǎn)權(quán)。隨后,美國3家數(shù)字新聞媒體The Intercept、Raw Story和AlterNet于2024年2月28日對OpenAI提起版權(quán)侵權(quán)訴訟。

  2024年6月,人工智能初創(chuàng)公司Perplexity相繼遭到《福布斯》以及科技媒體《連線》的內(nèi)容剽竊指控,聲稱在Perplexity的Pages工具中發(fā)現(xiàn)了他們的報道內(nèi)容。10月21日,媒體大亨魯珀特·默多克旗下新聞集團的子公司道瓊斯和《紐約郵報》對Perplexity提起訴訟,稱其“大量非法復制”他們的版權(quán)作品。

  音樂領(lǐng)域也不消停。2024年6月,美國唱片業(yè)協(xié)會起訴了兩家AI音樂公司——Suno和Udio,指控他們在訓練AI工具時,涉嫌侵犯音樂版權(quán)。

  此外,在加拿大、德國等也有類似的案例。中國人民大學法學院教授金海軍說,他統(tǒng)計了類似的訴訟,大概有十幾起,文字、圖片、音樂等各個領(lǐng)域的著作權(quán)作品都受到這個問題困擾。

  國內(nèi)也已有相關(guān)案例。2024年2月8日,廣州互聯(lián)網(wǎng)法院作出全球首例生成式人工智能平臺侵權(quán)責任判決,認定被告某AI公司侵犯了原告對奧特曼作品的復制權(quán)和改編權(quán)。

  同年4月23日,全國首例AI生成聲音人格權(quán)侵權(quán)案,在北京互聯(lián)網(wǎng)法院判決配音師勝訴,AI開發(fā)者使用配音師聲音、開發(fā)涉案AI文本轉(zhuǎn)語音產(chǎn)品未獲得合法授權(quán),構(gòu)成侵權(quán)。

  同年6月20日,北京互聯(lián)網(wǎng)法院在線開庭審理了四起畫師起訴AI繪畫軟件開發(fā)運營者著作權(quán)侵權(quán)案件,該案為全國首例涉AI繪畫大模型訓練著作權(quán)侵權(quán)案。

  商業(yè)使用尤為復雜

  目前,我國著作權(quán)法在AI生成物保護方面暫無明確規(guī)定;AI生成內(nèi)容的著作權(quán)歸屬于AI技術(shù)的開發(fā)者還是實際使用者尚存在爭議,有待法律和政策層面的明確指引。

  民間正在積極行動。2024年12月4日,中國文字著作權(quán)協(xié)會倡議:生成式人工智能語料庫建設(shè)等應確保數(shù)據(jù)來源合法,人工智能技術(shù)的發(fā)展既要保護創(chuàng)作者、內(nèi)容生產(chǎn)者合法權(quán)益,又要激發(fā)全社會創(chuàng)新創(chuàng)造活力,推動產(chǎn)業(yè)高質(zhì)量發(fā)展。

  當?shù)貢r間2024年12月16日,“人工智能創(chuàng)意權(quán)利聯(lián)盟”在英國正式成立,提出了有關(guān)版權(quán)與生成式人工智能政策的三項關(guān)鍵原則,并呼吁英國政府將這三項原則作為制定人工智能政策的框架。

  “上述大模型都需要有足夠的語料去訓練AI模型,而訓練過程中,必然要使用到大量含有版權(quán)的作品。這就涉及我們?nèi)绾问褂米髌,或者說如何合理使用作品等問題!崩罘禁愓f。

  金海軍認為,在健全相關(guān)制度方面,要特別關(guān)注AI生成內(nèi)容產(chǎn)生過程中的兩個部分。一是產(chǎn)出的階段,即AI生成的內(nèi)容到底能不能受著作權(quán)保護,即所謂的作品問題和作者資格問題;二是在輸入階段,在使用語料的時候,如果涉及享有著作權(quán)的作品,是否構(gòu)成侵權(quán)。如果構(gòu)成侵權(quán)的話,能否以合理使用來抗辯。

  “從國際上目前的情況來看,在認定是否構(gòu)成著作權(quán)法意義上的作品這一問題上,整體上是比較嚴格的。在輸入端使用作品的時候,相對來講要求比較寬松。但是有一個條件,在文本挖掘和數(shù)據(jù)訓練使用的時候是非商業(yè)性的。一旦進入商業(yè)系統(tǒng),恐怕也不能夠簡單地說,這就是侵權(quán)或者構(gòu)成合理使用!苯鸷\娬f。

  中國版權(quán)協(xié)會理事長閻曉宏認為,從技術(shù)角度來看,使用有版權(quán)的作品,在技術(shù)條件許可的情況下要公布相關(guān)信息,“讓人家知道你使用了什么”。原則上應該認為,這些使用是可行的,作品一一得到許可,事實上是做不到的。應當按照2022年12月印發(fā)的《中共中央 國務院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》中的“淡化所有權(quán)、強化使用權(quán)”為指導,加快立法,明確使用原則,如果涉及商業(yè)使用,則需要支付報酬,如何支付報酬,應當在國家版權(quán)局的指導下,由使用者和權(quán)利人組織協(xié)商解決。

  在此前召開的中歐數(shù)字環(huán)境下版權(quán)保護研討會上,中國國家版權(quán)局有關(guān)負責人指出,中國以積極的、前瞻性的思維迎接人工智能的到來,研究和監(jiān)管人工智能,完善制度設(shè)計,探索規(guī)范人工智能相關(guān)版權(quán)規(guī)則,加強對人工智能生成內(nèi)容傳播的監(jiān)測。

編輯:谷欣
更多精彩資訊請在應用市場下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費者也可通過央廣網(wǎng)“啄木鳥消費者投訴平臺”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責任。
長按二維碼
關(guān)注精彩內(nèi)容