□ 李建忠(湖北民族大學法學院講師)
隨著生成式人工智能技術的快速發(fā)展,訓練數(shù)據使用引發(fā)的復制權侵權認定困境日益凸顯。當前,實踐中仍采用傳統(tǒng)著作權法的“接觸+實質性相似”標準,忽視了AI技術通過向量化處理實現(xiàn)數(shù)據碎片化存儲的本質特征。筆者旨在分析現(xiàn)行法律制度與生成式AI技術特征的結構性矛盾,從立法創(chuàng)新、監(jiān)管協(xié)同與責任分層三個維度,構建適應技術發(fā)展的法治調適路徑,為平衡著作權保護與AI產業(yè)創(chuàng)新提供理論支撐。
生成式AI數(shù)據訓練中復制權侵權認定困境分析
一、技術特征與法律定性的爭議
生成式AI在數(shù)據訓練時引發(fā)的復制權侵權認定困境,本質上是其技術特點與現(xiàn)有法律體系之間出現(xiàn)的結構性錯位。從技術角度看,AI訓練通過算法把文本向量進行數(shù)學上的表征處理,最終形成碎片化、不連續(xù)的分布式存儲方式。這種方式與著作權法上完整表達形式固定的復制概念存在差異,著作權法對復制權的定義是以機械化復制的時代為基礎,難以適應深度學習的技術現(xiàn)狀,導致實踐中“功能等同論”和“技術例外論”存在分歧。處理訓練數(shù)據的目的是對模型的參數(shù)進行優(yōu)化,是技術實現(xiàn)的必要環(huán)節(jié),與以傳播為目的的內容復制存在根本區(qū)別。但是,法律的滯后性讓司法認定直接套用“接觸+實質性相似”標準,未考慮AI系統(tǒng)是通過海量數(shù)據學習抽象的特征,而不是復制具體表達內容這個運行邏輯。
二、現(xiàn)行法律制度適應困境
生成式AI在數(shù)據訓練時引發(fā)的復制權侵權認定困境,暴露出現(xiàn)行法律制度和技術發(fā)展之間存在深層的脫節(jié),我國著作權法對復制權的界定以傳統(tǒng)復制行為作為基準,無法覆蓋AI訓練中數(shù)據碎片化存儲、向量化處理等新型技術特點。實踐中機械適用“接觸+實質性相似”標準,未考慮AI系統(tǒng)是通過海量數(shù)據學習抽象特征而不是復制具體表達內容的運行邏輯,導致裁判尺度不一、證據規(guī)則體系也面臨挑戰(zhàn)。AI訓練的“黑箱”特點讓權利人很難獲得完整的證據鏈,而且舉證責任分配機制未適配技術特性,導致維權成本較高。
法治調適的系統(tǒng)性建構路徑
一、立法層面的創(chuàng)新突破
立法層面的創(chuàng)新突破是破解生成式AI數(shù)據訓練復制權侵權認定困境的關鍵。需構建“技術性復制”與“傳播性復制”的二元立法框架:前者明確訓練數(shù)據必要處理行為的合法性邊界,后者規(guī)范內容傳播環(huán)節(jié)的侵權責任。應借鑒《生成式人工智能服務管理暫行辦法》的監(jiān)管思路,在著作權法中增設“算法透明度”條款,要求AI企業(yè)披露訓練數(shù)據來源及處理方式。同時,建立著作權補償金制度,按訓練數(shù)據規(guī)模由AI企業(yè)繳納專項基金,通過集體管理組織分配收益;需明確“合理使用”的適用標準,對非營利性研究、文化遺產保護等場景給予特別豁免。這些創(chuàng)新突破需與司法實踐、行業(yè)自律形成合力,最終實現(xiàn)技術創(chuàng)新與權利保護的動態(tài)平衡。
二、監(jiān)管機制的協(xié)同配套
生成式AI數(shù)據訓練的法治調適需構建監(jiān)管協(xié)同機制。當前《生成式人工智能服務管理暫行辦法》確立的備案制與算法備案制度,為監(jiān)管協(xié)同提供了制度基礎。需建立“技術—法律—行業(yè)”三維監(jiān)管框架:技術層面推行區(qū)塊鏈存證系統(tǒng),實現(xiàn)訓練數(shù)據全流程可追溯;法律層面完善“通知—刪除”規(guī)則,要求平臺建立侵權內容過濾機制;行業(yè)層面推動成立AI數(shù)據合規(guī)聯(lián)盟,制定數(shù)據使用白名單。針對監(jiān)管主體碎片化問題,可構建多部門參與的聯(lián)合監(jiān)管模式,建立跨部門數(shù)據共享平臺。在責任分配上,應區(qū)分基礎模型提供商與垂直應用開發(fā)商的責任邊界,對開源模型實施差異化監(jiān)管。通過監(jiān)管沙盒機制,在保障安全的前提下促進技術創(chuàng)新,實現(xiàn)從被動應對到主動治理的轉變。
三、責任認定的分層機制
現(xiàn)行侵權責任認定機制在應對生成式AI數(shù)據訓練時面臨主體模糊困境,亟須構建分層責任體系。根據《生成式人工智能服務管理暫行辦法》,應以“控制力+獲益程度”標準劃分責任。AI模型開發(fā)者作為核心控制方,承擔數(shù)據來源合法性審查義務,對訓練數(shù)據侵權負首要責任;數(shù)據提供者若明知侵權仍參與的,應承擔連帶責任;平臺運營者需履行“通知—刪除”義務,可基于技術中立性獲得責任豁免。
在責任認定程序上,應建立“技術溯源+過錯推定”機制。通過區(qū)塊鏈存證固定訓練數(shù)據調用路徑,對無法自證清白的開發(fā)者推定過錯。同時,引入“避風港規(guī)則”的升級版,要求開發(fā)者建立數(shù)據過濾系統(tǒng),對明顯侵權內容自動攔截。這種分層機制既符合民法典侵權責任編的立法精神,又能適應AI產業(yè)快速迭代的特性,為司法實踐提供可操作的判斷標準。
在人工智能技術飛速發(fā)展的時代背景下,通過構建科學合理的法治調適體系,能夠在保護著作權人合法權益與促進AI產業(yè)創(chuàng)新發(fā)展之間找到平衡點,為生成式人工智能的健康可持續(xù)發(fā)展保駕護航。
編輯:武卓立