为人工智能创作营造著作权空间
随着人工智能技术的快速发展和广泛应用,近年来,由人工智能自主创作诗歌、小说、绘画、音乐等已不再是新鲜事情。人工智能创作需要创作素材来“喂养”,这些创作素材是以数据形式表现的各种数字化作品,由此面临著作权侵权风险问题。如何妥当地解决这一问题,对人工智能技术的广泛应用和社会文化艺术的繁荣发展有着重要意义。
?
2019年10月11日晚,以《我和我的祖国》《在希望的田野上》等经典曲目为基础,由人工智能创作的包括五个变奏段落的交响曲在深圳音乐厅上演。此次尝试是运用人工智能技术创作多声部、广维度,同时具备复杂性和经典传承性的长篇幅交响乐曲作品,创作过程中运用了多重技术模型,并首创了AVM自动变奏模型。资料照片
?
对数据的“表达性使用”使人工智能创作面临著作权侵权风险
?
数据的获取与利用贯穿人工智能创作全过程。
?
首先是数据的获取与输入,这一环节也可称为“机器阅读”。据微软公司的人工智能研发人员介绍,世界上第一部百分之百由人工智能作者“小冰”于2017年创作的诗集《阳光失了玻璃窗》,就是人工智能在学习了500多位诗人的现代诗后,经过上万次训练最终创作而成。其次是数据的处理与分析,这一环节也可称为“机器学习”。人工智能系统通过对大量已有数据作品进行分类和整理,分析这些作品所表达的思想感情、所采用的语言特征、所特有的表达风格等。最后是数据的生成与传播,这一环节也可称为“机器输出”。由此生成的结果可以达到作品的独创性,有些甚至比人类作者创作的作品更具有艺术价值。
?
但是,在这一过程中,对数据的“表达性使用”使人工智能创作面临著作权侵权风险。
?
这里采用“非表达性使用”一词,是指使用原作品的目的并非为了利用其具有独创性的表达,而是将其作为一种事实性信息进行功能性利用,在使用结果上也未再现原作品的艺术价值;“表达性使用”则是指使用原作品的目的在于利用其独创性表达,从而在使用结果上也再现了其艺术价值(无论是“原样再现”或“改编再现”)。
?
人工智能对数据作品的使用也有“表达性使用”和“非表达性使用”之区分。例如为了运行人脸识别智能系统而使用人脸照片就是一种“非表达性使用”。而我们所探讨的“人工智能创作”对于数据作品的使用显然属于“表达性使用”。
?
人工智能创作利用数据的侵权类型
?
人工智能创作利用数据,可能侵害的权利类型包括:
?
复制权
?
在人工智能进行深度自主学习之前,需要将作为创作素材的作品进行数字化处理并转换为适合“机器阅读”的标准数据格式,是对已有作品在不改变内容情形下所进行的全文复制和原样再现,并且存储在机器中形成永久复制件,属于著作权法上的“复制”行为。现行《著作权法》在原有7种复制类型后专门增加了“数字化”复制方式。在作品输出环节,如果人工智能最终输出的内容与之前所使用的数据作品存在实质性相似,则同样可能会侵犯复制权。
?
改编权
?
在人工智能创作中,如果最终输出的生成内容虽具有一定的独创性,但仍然保留了数据库中某一作品或者某些作品的基本表达,应属于改编作品,此种创作行为如未经许可并支付报酬则可能侵害改编权。如微软公司开发的“下一个伦勃朗”人工智能系统,通过深度学习伦勃朗346幅画创作出了与伦勃朗风格相似但又具有独创性的绘画作品。如果被学习的作品仍在著作权保护期限内,则都属于侵犯改编权的行为。
?
传播权
?
在我国现行立法中,传播权包括表演权、放映权、广播权和信息网络传播权。人工智能创作涉及的传播权侵权风险主要是信息网络传播权和广播权,表现在人工智能创作的输出环节:若将机器学习的数据分析结果通过网络即时公开发布,可能会侵犯作品广播权;如果延时发布,则可能侵犯信息网络传播权。
?
著作权法上有侵权豁免规定,理由一般有合理使用、法定许可和强制许可三种类型。我国现行立法中尚无强制许可制度。法定许可规则所确定的四种类型也难以适用于人工智能创作场合。几种合理使用情形最有可能作为侵权抗辩依据,但是:就“个人学习、研究”这条而言,人工智能创作并不符合该条款的规范意旨,“个人”通常限于自然人,人工智能创作中使用数据的行为主体为人工智能系统,并非自然人,控制人工智能创作系统的主体也并非单个的自然人;“科学研究”这条,根据我国现行《著作权法》第24条第1款第(六)项的规定,在“为科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供科研人员使用,但不得出版发行”情形下,可以不经著作权人许可亦无须支付报酬,人工智能创作也无法适用;“适当引用”这条也难以作为对人工智能创作使用数据予以侵权豁免的法律依据,人工智能创作对于数据作品的使用显然已经超出了适当性的要求。
?
将人工智能创作利用数据纳入合理使用的考量
?
传统许可模式难以满足数据规模化利用的现实考量
?
人工智能创作所使用的数据在价值上具有低密度性,即单个作品对最终形成的创作成果贡献极小,由此意味着只有大批量、规模化地使用数据对于人工智能创作才有意义。要避免人工智能创作物一经生成便背负上侵权的“原罪”风险,唯一途径就是逐一获得数据作品著作权人的许可并支付报酬,而这在现实中几乎不太可能。此时,采用合理使用规则来配置数据资源可能是实现社会福利和公共利益最大化的最佳选择。
?
促进文化艺术繁荣的公共政策考量
?
为了降低使用成本并消除侵权风险,人工智能企业往往倾向于将受著作权保护的作品剔除出数据库,而更多使用那些不受著作权保护的处于公共领域的数据来训练人工智能,如此会造成创作结果的同质化和低劣化,不利于著作权法“促进文化艺术繁荣”价值目标的实现。
?
当人工智能研发者无法获得著作权人的许可时,机器学习的资源必然会局限在已经进入公共领域的作品中,但这些已处于公共领域的作品无法全面反映人类最新的智慧成果,势必将会导致人工智能创作的作品存在隐形偏见。
?
维护公平竞争的市场秩序考量
?
一些大型互联网企业(例如谷歌、微软、腾讯、苹果、百度等)通过设置所谓“服务条款”或者“用户须知”格式条款,要求用户在注册时选择允许互联网企业免费使用用户发布的信息,这样就给大型互联网企业采取“以服务换取数据”模式免费使用用户的数据提供了机会,从而为互联网企业规避著作权侵权风险提供了可能。但是,这种“以服务换取数据”模式通常只适用于大型互联网企业,中小企业则因为用户数量少,可以免费使用的数据无论在数量还是质量上都无法与大公司相比,久而久之会形成强者更强、弱者更弱的不公平的市场竞争环境。
?
促进人工智能技术发展的国家战略考量
?
国务院早在2017年7月就发布了《关于印发新一代人工智能发展规划的通知》。于此背景下,积极营造有利于人工智能技术应用和产业发展的法治环境具有回应国家战略关切、提升我国人工智能领域国际竞争力的现实意义。为了在新一轮科技革命和产业变革的激烈竞争中立于不败之地,我国应为人工智能创作使用数据提供较为宽松的法律环境。
?
数据作品合理使用规则的比较法考量
?
为化解人工智能创作使用数据的著作权侵权风险,欧盟2019年正式通过的欧盟《DSM指令》通过两个条文细化了“文本与数据挖掘著作权例外”的内容。2018年《日本著作权法》修订时将计算机使用数据的范围从“计算机信息分析”拓展为所有“提供新的知识和信息”领域。修订后的规定将可以享受侵权豁免的行为从原来的复制、改编进一步扩大到了向公众提供,同时不限定适用的主体和目的,为商业机构的营利性使用留下了适用空间。美国法以其较为灵活和极具解释空间的开放式合理使用规则为人工智能技术应用提供了更好的发展环境。近年来,美国法院在论文查重、人脸识别、数字图书馆建设等案件中对转换性使用规则采取了较为宽泛的解释,以适应“机器阅读和创作”之需。
?
怎样把人工智能创作使用数据纳入合理使用
?
适用主体
?
欧盟《DSM指令》以两个条文框定“文本与数据挖掘”的适用主体。第4条没有明确限定适用主体的范围,而是从行为方式角度进行了规定,即“以文本和数据挖掘为目的,对合法获取的作品或其他内容进行复制与提取”的实施主体。可见,第4条并未将其适用主体局限于公益性研究机构。2009年《日本著作权法》中的“计算机信息分析”条款和2018年《日本著作权法》中的“提供新的知识和信息”条款均未限定适用主体。《美国版权法》亦未限定适用主体。就我国立法而言,日本不限定适用主体的做法更值得借鉴。
?
适用目的
?
欧盟《DSM指令》正式文本第4条则删除了“以科学研究为目的”的限定,从行为方式上对其适用条件进行了规定。学界普遍认为,该条“将适用主体扩展至含有商业性开发意义的私人主体”。在《日本著作权法》中,无论是2009年的“计算机信息分析”条款,还是2018年的“提供新的知识和信息”条款,都未排除商业目的数据使用行为。《美国版权法》“四要素标准”中的第一个要素虽然关注作品使用行为的商业性质,但并不排除具有商业目的的使用行为仍然可以构成合理使用。就我国立法而言,可借鉴《DSM指令》第4条和《日本著作权法》的做法,不以非营利目的作为适用条件。企业的研发机构显然服务于企业商业目的,若因商业性质将此种研究排除于合理使用之外,既不利于企业创新,也不符合国家的政策导向。
?
适用行为
?
欧盟《DSM指令》第3条将其适用行为规定为“复制与提取”,第4条也是如此。有学者认为,并不能完全解决事关文本和数据挖掘研究事业发展中出现的重大法律障碍问题。2018年《日本著作权法》将其适用行为规定为“复制、整理、向公众提供”三种。
?
就我国立法而言,首先需要明确的是,合理使用规则所适用的行为应属于《著作权法》规制的行为。概言之,能够受到合理使用规则豁免的行为应在现行《著作权法》所规定的具体的著作权专有权项控制的范围内,否则合理使用无从谈起。依此而言,欧盟《DSM指令》中的“提取”行为、《日本著作权法》中的“记录”、“整理”、“向公众提供”行为,在我国现行《著作权法》中并无直接的专有权利与其对应,但从这些行为的本质特征和法律效果来看,可以被现行立法中的复制权、改编权、广播权以及信息网络传播权所涵盖。结合人工智能创作使用数据可能涉及的侵权类型分析,建议将此种合理使用适用的行为规定为复制、改编、广播和信息网络传播四种。
?
综上,建议在现行《著作权法》第24条第1款(十二)项之后增加一项新的“人工智能创作”合理使用类型,即“……(十三)为人工智能创作复制、改编他人作品,以及将创作成果以广播、信息网络传播方式向公众提供”。