生成式人工智能创作中使用作品属于合理使用吗?
以ChatGPT为代表的生成式人工智能(AIGC)技术已在很多行业投入商用,有画家发现AI生成的图片和自己的作品很像,继而怀疑自己的在先作品在AI创作过程中被使用了。AI未经许可使用他人作品进行训练,属于著作权法意义上的合理使用吗?
一、什么是生成式人工智能
生成式人工智能是一种能够创建原创内容的人工智能,它通过对海量的规模作品进行深度学习,并根据用户的提示或请求生成文本、图像、视频、音频等内容。
生成式人工智能的创作过程主要分为三个阶段进行,数据输入、机器学习、结果输出。数据输入属于机器阅读阶段,机器阅读的文本包括各类著作权作品,如文本、图画、音乐等。数据输入是人工智能创作的基础和前提,没有数据输入,就没有机器创作。机器学习是人工智能创作的实施阶段,是一种类人类化的创作过程。人工智能的神经网络系统是通过高仿人类神经网络系统特征而构建的,它能够通过对大量的数据进行学习理解,并总结出规律。结果输出,是机器算法规则的结果。人工智能根据已有学习模式对作品数据的挖掘,并根据用户提示,进行自我优化并输出新作品。人工智能生成的作品是否属于著作权法上的作品,主要聚焦在该类作品是否具有独创性特征。
二、机器阅读作品的合法性问题
生成式人工智能无法凭空创造内容。文本数据的输入、存储为机器学习、结果输出提供了材料来源,是人工智能时代科研活动和商业开发的基础。越是充分且优质的数据,人工智能通过学习后就越能创造出更为优质的内容,数据的规模和质量直接影响生成内容的质量。
然而在著作权方面,人工智能创作涉及的首要难题,是机器学习中数据获取和使用的合法性问题。未经许可对他人的数据进行扫描、抓取、存储等行为,是否合法?这一问题不仅本身涉及合法性,它还决定了机器学习、结果输出等后续行为是否正当。根据我国《著作权法》规定,作品的合法使用路径主要有三种,授权许可使用、合理使用、法定许可使用。它们之间的区别主要在于:授权许可使用通常表现为经过著作人的许可付费使用;在合理使用中,用户则既不需要著作权人的许可,也不需要付费,它表现在个人的学习、研究、欣赏,时事新闻报道中使用他人的作品等情形;法定许可使用则是有偿使用他人作品,但是不需要经过著作权人同意。
在这三种合法使用方式中,人工智能的数据输入属于哪一种类型呢?无论是授权许可使用,还是法定许可使用都属于付费使用,一方面,超大规模的数据投喂,如果每一作品都需要付费,未免交易成本过高,另一方面,这种付费可能导致出现大型人工智能企业赢者通吃的局面。大型企业可以通过著作权许可甚至是独家许可、提供服务等方式获取作品数据,避免著作权风险,而中小型企业的研发却囿于自身实力止步不前,或只能从公共领域获取有限的免费作品数据,经济实力的不平衡将导致两者的技术差距越来越大,甚至出现恶性垄断的市场乱序。因此,这两种使用方式不可取。那么人工智能数据输入是否属于著作权法中的合理使用范畴呢?
三、机器阅读作品的合理性问题
我国现行的《著作权法》第24条第1款通过“概括+列举”的方式规定了作品的合理使用范围,增加了国际层面著作权合理使用认定标准极为重要的“三步检测法”,即在特定情形下,不影响作品的正常使用,不得不合理地损害著作权人的合法利益。然而,法条列举的12种具体情形并不包括人工智能发展所必须的文本输入与数据挖掘等情形。虽然第13项增加了兜底条款,即“法律、行政法规规定的其他情形”,但在具体案件的判断上仍存在较大疑虑。
2023年7月,国家网信办等七部门联合发布《生成式人工智能服务管理暂行办法》(以下简称《办法》),旨在促进生成式人工智能健康发展和规范应用。《办法》第7条明确提到生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;对于涉及知识产权的,不得侵害他人依法享有的知识产权。
应当说,生成式人工智能在用户提示下从事的部分内容输出,对于经济、文化产业的发展有着极大的推动作用。对于著作权保护与产业发展之间的冲突,有学者提出应借鉴欧盟和日本,在著作权立法中将“文本数据挖掘”增列为一项新的合理使用情形,这也许是一个比较好的选择。从国家的战略导向看,我国目前的生成式人工智能技术还处在初级阶段,依然在很大程度上需要借助现有的智力成果,并在适法范围内尽可能促进数据的自由流动,实现产业的迭代升级,对加强著作权保护的同时,还应当考虑国家技术创新与数字产业迅速发展的需要。
法条链接
《著作权法》第二十四条 在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益:
(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;
(二)为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品;
(三)为报道新闻,在报纸、期刊、广播电台、电视台等媒体中不可避免地再现或者引用已经发表的作品;
(四)报纸、期刊、广播电台、电视台等媒体刊登或者播放其他报纸、期刊、广播电台、电视台等媒体已经发表的关于政治、经济、宗教问题的时事性文章,但著作权人声明不许刊登、播放的除外;
(五)报纸、期刊、广播电台、电视台等媒体刊登或者播放在公众集会上发表的讲话,但作者声明不许刊登、播放的除外;
(六)为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;
(七)国家机关为执行公务在合理范围内使用已经发表的作品;
(八)图书馆、档案馆、纪念馆、博物馆、美术馆、文化馆等为陈列或者保存版本的需要,复制本馆收藏的作品;
(九)免费表演已经发表的作品,该表演未向公众收取费用,也未向表演者支付报酬,且不以营利为目的;
(十)对设置或者陈列在公共场所的艺术作品进行临摹、绘画、摄影、录像;
(十一)将中国公民、法人或者非法人组织已经发表的以国家通用语言文字创作的作品翻译成少数民族语言文字作品在国内出版发行;
(十二)以阅读障碍者能够感知的无障碍方式向其提供已经发表的作品;
(十三)法律、行政法规规定的其他情形。