【析理論道】
作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成式人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。近年來,美國接連出臺多項人工智能戰(zhàn)略和政策文件,以謀求維持其在該領(lǐng)域的領(lǐng)先地位。歐盟也試圖通過立法打破數(shù)據(jù)孤島、構(gòu)建基于風險的分層規(guī)制體系,提升人工智能產(chǎn)業(yè)競爭力?;跀?shù)據(jù)要素稟賦,中國在發(fā)展生成式人工智能領(lǐng)域具有戰(zhàn)略優(yōu)勢。2023年中央經(jīng)濟工作會議指出:“要大力推進新型工業(yè)化,發(fā)展數(shù)字經(jīng)濟,加快推動人工智能發(fā)展。”為進一步促進生成式人工智能的快速發(fā)展,應(yīng)構(gòu)建生成式人工智能促進型法律制度,進一步優(yōu)化個人信息保護,協(xié)調(diào)著作權(quán)保護,推動企業(yè)數(shù)據(jù)互聯(lián),用制度創(chuàng)新破解數(shù)據(jù)瓶頸,為生成式人工智能發(fā)展提供法治保障,在激烈的國際競爭中搶占主動權(quán)和制高點。
完善個人信息保護,增強訓練數(shù)據(jù)供給
個人信息是生成式人工智能訓練數(shù)據(jù)的重要來源。生成式人工智能訓練數(shù)據(jù)的形成,有賴于對個人信息保護制度的正確理解與適用,涉及個人信息保護法中的告知同意制度、必要性原則以及公開性個人信息的利用等法律規(guī)范。具體而言,告知同意制度能夠給予個體一定的自我保護,防止信息處理者過度收集個人信息。但面對信息處理的復雜實踐,受認知所限,個體有可能難以真正預(yù)防風險。必要性原則強調(diào)收集個人信息的限制與處理最小化。若對必要性原則進行僵化解釋,則任何包含個人信息的數(shù)據(jù)都無法用于人工智能訓練,這反而可能導致人工智能因為缺少某些數(shù)據(jù)訓練而變得具有歧視性、不公平性。公開數(shù)據(jù)是生成式人工智能數(shù)據(jù)的主要來源,而這些數(shù)據(jù)往往缺乏交互場景和聯(lián)系方式,信息處理者難以聯(lián)系個人和獲取個人同意。
為破解生成式人工智能在個人信息數(shù)據(jù)收集與利用方面的障礙,應(yīng)在保障個人信息安全的前提下,進一步完善個人信息保護制度。首先,對于已公開的個人信息,應(yīng)以廣泛匯聚與融合利用為前提,于技術(shù)層面構(gòu)建去標識化、差分隱私等程序性保護機制,并輔之以個人拒絕權(quán)等機制。其次,當人工智能訓練中的數(shù)據(jù)包含個人信息時,應(yīng)區(qū)分改進型與侵害型的個人信息處理。如果人工智能訓練數(shù)據(jù)是為了實現(xiàn)更為公平與準確的個人信息處理,應(yīng)將此類訓練視為符合個人信息處理目的,反之則應(yīng)視為違反必要性原則。最后,應(yīng)當優(yōu)化告知同意制度,強化隱私政策告知、加強合作治理。在個體私力救濟不足的情況下,應(yīng)強化執(zhí)法者對隱私政策的執(zhí)行、市場機構(gòu)對隱私政策與個人信息保護實踐的評級、信息處理者內(nèi)部的個人信息合規(guī)機制。
立法既要為訓練數(shù)據(jù)提供制度供給,也要為個人信息安全提供保障。對于人工智能企業(yè)合法獲取的包含個人信息的數(shù)據(jù),應(yīng)在數(shù)據(jù)清洗、數(shù)據(jù)標準、模型訓練和評估、模型部署等階段,對個人信息數(shù)據(jù)進行全生命周期的監(jiān)管,進一步強化生成式人工智能企業(yè)的處理者責任。在技術(shù)層面,應(yīng)要求人工智能企業(yè)依托加密技術(shù)、隱私計算等技術(shù)化手段保護個人信息。在制度層面,應(yīng)要求人工智能企業(yè)通過內(nèi)部合規(guī)、設(shè)立數(shù)據(jù)保護專員、合規(guī)審計與風險評估等機制嚴格保護個人信息。
協(xié)調(diào)著作權(quán)保護,規(guī)范內(nèi)容數(shù)據(jù)合理使用
著作權(quán)保護的門檻并不高,只要求作品具有獨創(chuàng)性并能以一定形式表現(xiàn)。因此,人工智能企業(yè)利用網(wǎng)絡(luò)上的文字、圖片、聲音等素材的內(nèi)容數(shù)據(jù)進行訓練,便有可能構(gòu)成著作權(quán)侵權(quán),面臨巨大訴訟壓力、賠償壓力以及社會聲譽壓力。由于多數(shù)內(nèi)容數(shù)據(jù)的著作權(quán)分散于各個著作權(quán)人,人工智能企業(yè)可能難以直接與他們聯(lián)系。即使聯(lián)系到這些著作權(quán)人,在要價問題上也面臨種種困難。既有的數(shù)據(jù)庫和各類著作權(quán)集體管理組織可以在一定程度上解決著作權(quán)許可問題,但對于網(wǎng)絡(luò)上的內(nèi)容數(shù)據(jù)而言,由于數(shù)據(jù)容量以及適用領(lǐng)域等方面的限制,其作用相對有限。
破解生成式人工智能內(nèi)容數(shù)據(jù)的著作權(quán)約束,需要構(gòu)建整體性的合理使用制度。生成式人工智能與非生成式人工智能相比,對于數(shù)據(jù)的利用具有復雜性,其對著作權(quán)作品數(shù)據(jù)的利用常常既涉及事實,也涉及表達,但整體上屬于合理適用范圍。具體來說,就人格權(quán)益而言,生成式人工智能利用海量數(shù)據(jù)而非特定作品進行訓練,一般不會侵害某一特定作品中所包含的人格權(quán)益;就激勵機制而言,生成式人工智能利用海量數(shù)據(jù)進行訓練,主要是為了提高其一般性的識別與創(chuàng)作能力,而不是替代某一特定作品,作者也不會因為生成式人工智能作品的出現(xiàn)而不再進行創(chuàng)作。當然,如果生成式人工智能對于著作權(quán)數(shù)據(jù)的訓練破壞了權(quán)利人的技術(shù)措施或相關(guān)協(xié)議,或者當生成式人工智能對于著作權(quán)數(shù)據(jù)的利用是“假訓練、真剽竊”,那么此類行為就對人格權(quán)益與激勵制度產(chǎn)生負面影響,應(yīng)當被排除在合理使用之外。
生成式人工智能企業(yè)在對著作權(quán)作品進行寬泛合理使用的同時,也需要承擔與此相對應(yīng)的更多責任。首先,生成式人工智能企業(yè)應(yīng)踐行社會主義核心價值觀,積極承擔社會責任,避免數(shù)據(jù)與算法歧視方面的風險與侵害。其次,生成式人工智能企業(yè)應(yīng)對實質(zhì)性相似的生成作品承擔侵權(quán)責任,這既有利于保護作品原創(chuàng)者的合法權(quán)益,也有利于激勵企業(yè)的技術(shù)創(chuàng)新。最后,法律應(yīng)審慎對各類生成類作品賦予著作權(quán)。人工智能領(lǐng)域的激勵機制在于鼓勵人工智能技術(shù)的發(fā)展與創(chuàng)新,而非激勵生成作品的生產(chǎn)??梢詫⑷斯ぶ悄艿纳勺髌分糜诠差I(lǐng)域,允許公眾與企業(yè)對其進行一般利用。生成式人工智能企業(yè)也可以推出用戶付費版本,通過用戶協(xié)議和向用戶收取使用費用來獲得報酬,這可以為人工智能企業(yè)提供合理的商業(yè)激勵。
破除企業(yè)數(shù)據(jù)壁壘,助推數(shù)據(jù)匯聚融合
破除企業(yè)數(shù)據(jù)壁壘,需要倡導互聯(lián)網(wǎng)的互聯(lián)互通。網(wǎng)絡(luò)互聯(lián)曾經(jīng)是互聯(lián)網(wǎng)的核心精神之一,但隨著互聯(lián)網(wǎng)的發(fā)展和商業(yè)化,出于競爭或安全等考量,互聯(lián)網(wǎng)企業(yè)往往打造封閉型數(shù)據(jù)生態(tài)系統(tǒng),防止其他企業(yè)特別是競爭企業(yè)獲取其數(shù)據(jù)。這導致了數(shù)據(jù)孤島現(xiàn)象,抑制了數(shù)據(jù)共享紅利的溢出效應(yīng)。對于企業(yè)而言,僅僅依靠自身掌握的商業(yè)數(shù)據(jù)進行訓練,難以觸及其他企業(yè)獨占的高質(zhì)量數(shù)據(jù),勢必會制約生成式人工智能的訓練效果。
就數(shù)據(jù)互聯(lián)而言,應(yīng)避免對網(wǎng)絡(luò)公開數(shù)據(jù)進行絕對排他性確權(quán)。過去幾十年來,網(wǎng)絡(luò)公共空間的興起導致了數(shù)據(jù)的爆發(fā)性增長,為人工智能等技術(shù)的發(fā)展奠定了堅實的數(shù)據(jù)基礎(chǔ)。隨著數(shù)據(jù)價值的凸顯,數(shù)據(jù)的利益分配成為各方關(guān)注焦點,不少聲音呼吁通過對數(shù)據(jù)確權(quán)實現(xiàn)此類分配。但基于數(shù)據(jù)的公共性特征,過多的排他性權(quán)利保護可能導致社會對它們的利用不足,構(gòu)成“反公地悲劇”。數(shù)據(jù)的公共性并不否認對數(shù)據(jù)權(quán)益的合理保護,數(shù)據(jù)的合理保護同樣是一種公共善品,有利于激發(fā)私主體的創(chuàng)造和個體有價值數(shù)據(jù)的公開;同樣,數(shù)據(jù)的公共性也不否認數(shù)據(jù)利用的公平性需求,而這種公平性不應(yīng)依賴微型權(quán)益確權(quán)或強化企業(yè)的數(shù)據(jù)排他性確權(quán)來實現(xiàn),而應(yīng)創(chuàng)新數(shù)據(jù)利用的收益分配機制,實現(xiàn)效率與公平的協(xié)調(diào)。
破除企業(yè)數(shù)據(jù)壁壘,也可以利用各類合理的爬蟲機制打通不同企業(yè)之間的數(shù)據(jù)壁壘?;跀?shù)據(jù)的非競爭性與爬蟲技術(shù)的中立性特征,應(yīng)當認識到爬蟲等行為一般不會影響數(shù)據(jù)持有者的合法權(quán)益,如果運用得當,反而會承載促進互聯(lián)的作用。尤其在數(shù)據(jù)企業(yè)紛紛設(shè)置壁壘、互相防范的情形下,合理的數(shù)據(jù)爬蟲可以成為不同企業(yè)數(shù)據(jù)融合的橋梁。為此,對于規(guī)范性的數(shù)據(jù)爬蟲不應(yīng)施加過多限制。對于造成宕機等后果的數(shù)據(jù)爬蟲,可以根據(jù)侵權(quán)責任法進行應(yīng)對,謹慎適用刑事措施。此外,網(wǎng)信部門可以通過鼓勵行業(yè)自律等方式,在倡導互聯(lián)網(wǎng)企業(yè)合理自治的同時,助推企業(yè)之間互聯(lián)互通,營造多樣化互聯(lián)網(wǎng)生態(tài)。在生成式人工智能等技術(shù)日新月異的背景下,企業(yè)呈現(xiàn)出前所未有的數(shù)據(jù)融合需求,應(yīng)利用法律與行業(yè)自律的方式共同推動數(shù)據(jù)互聯(lián),為生成式人工智能企業(yè)提供充足的數(shù)據(jù)源,助力企業(yè)良性競爭、持續(xù)創(chuàng)新。
(作者:王業(yè)亮、丁曉東,分別系中國人民大學法學院博士后,中國人民大學法學院教授、未來法治研究院副院長)