清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

近日,360创始人周鸿祎谈到了近期舆论热议的AI课程乱象,并明确地提出“2024年会是大模型场景应用元年”,需要用最粗浅的语言解释最高深的技术,为大家做好AI科普,迎接人工智能时代的到来。问题在于,AI科普无法回避以AIGC的可版权性及权利归属为核心的一系列,AI课程推广过程中亟需解决的著作权法律问题,飒姐团队便与大家聊一聊AIGC的著作权相关问题,供诸位参考。

01 AIGC的可版权性——作品认定与权利保护的二分

人工智能生成内容(AIGC)是指利用神经网络、生成扩散模型和大型预训练模型等人工智能技术,通过寻找现有数据的规律,重塑内容生成的一种方式或技术。

根据《著作权法》规定:“作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。”独创性的要义在于“独”、“创”二字。所谓“独”,是指作品是作者自己的创作,不是对他人作品的抄袭或复制。AIGC是人工智能基于“深度学习”,模仿人脑机制对海量数据的特征进行组合,形成更高层次的属性类别或特征,而构建算法模型后所输出的内容,显然符合该要求。“创”即人格要素的思想表达,“作品是作者人格的反映”,通过运用文字、色彩、图形等要素,个人内心的情感、思想、立场等显见于作品之中。而目前的人工智能识是一种具有自我学习和理性行动能力的智能系统,面对新的数据可以进行自行判断、学习后生成相关内容,其产出属于“具有客观性的独创性表达”。

著作权法只保护外在的表达性形式,换言之,一个智力成果是不是“作品,”只需要依据展现在外的表达是否具有独创性进行认定,而不探求创作者的真实想法和创作过程。单纯从这一角度看,AIGC当然具有可版权性。

问题在于,这一结论与我国著作权法的法律框架相悖。正如上文所言,作品是人格的反映,作品本质上是作者的意志,“人格价值观”是著作权立法的哲学基础,自然人作者始终与其作品紧密联系在一起。此外,权利和义务、责任相统一,AI没有独立的意思能力,也没有相应的社会属性,因此不能作为著作权人去理性并真实地享有权利、履行义务和承担责任。尽管如此,我们也不能去否定AIGC具有思想表现形式的作品外观。

飒姐团队提醒,作品的认定与作品的著作权保护是两个不同层次的概念,独创性表达并不是自然人所独有的智力或思想,但在人类中心主义的价值体系下,著作权只应由自然人作者(或拟制作者)来享有,这有利于实现著作权法的创作激励目的。虽然著作权并不能归属于人工智能本身,但AIGC由于符合法律对于作品的定义,其内容本身具有可版权性。

02 AIGC背后的人类劳动——工具说之突破

技术永远无法取代人的思想,无法也不应等同于人的创造性思考。如果我们要在法教义学上解决人工智能生成内容可版权性及其权利归属上的悖论,仍然需要回到“人”在人工智能内容生成中的真实作用这个基本问题。工具说认为,生成式AI是人类创作作品的工具,本质上与纸笔、树枝等工具无异,因此AIGC就是人的智力成果。该说有一定合理性,但伴随着AI行业的发展,机器介入创作逐渐演化成一种理性的计算、情感的计算,从而表现出类人化的智力活动。

相比于单纯的辅助工作,AIGC更像是基于使用者的指示或委托进行创作的“机器作者”,使用者的智力投入与AIGC产出作品间的关系具有间接性与弱相关性。根据《著作权法实施条例》,“创作”是基于自由意志直接决定表达性要素的行为,作者的自由意志应在其中发挥着决定性作用。而人工智能的使用者并不决定人工智能的输出内容,其提示(prompt)更多产生引导模型生成高质量、有针对性输出的间接影响罢了。以AI绘画软件DALL·E为例,飒姐团队输入“可爱的恐龙宝宝在画画”为指示,最终生成了10张风格迥异的图片,除了都有恐龙宝宝主体和“画画”动作的这一共性外,色彩、布局、风格等其他要素便各不相同,这也说明了输入的prompt在功能上倾向于建议并非是命令。

AIGC的实质性贡献主体是人工智能本身,从客观上讲,人工智能是作品的创作者,理应享有著作权,但法律的价值决定了人工智能目前不可能具有法律主体性质,更说不上拥有权利能力和行为能力。我们该如何破除这一僵局?飒姐团队认为,或许可以参考美国著作权法的“视为作者”(Work for hire doctrine)来确认AIGC的著作权归属问题。

根据美国1976年版权法规定,该原则是指:雇员在其雇员范围内制作的作品或受第三方委托制作的某些作品的版权所有权最初属于雇主或委托方,而不属于作品的作者/创作者。

也就是说,作品的实际创造者并不一定是作品的法律作者(即著作权归属主体)。基于此,我们可以对“人类创作中心主义”进行修正,将并不直接决定创作结果的主体,如人工智能的训练者、投资者等视为作品的法律作者,从而一方面回应人工智能从“辅助者”到“生产者”的角色转换,另一方面使得AIGC的版权问题可以在《著作权法》的法律体系和价值框架下找到“自己的位置”,在以人为本的基本精神下最大程度弱化法律修正可能带来的冲击和不适,使其符合时代和法律发展的双重规律。

03 数据输入 —— 合理使用还是侵权行为?

数据是AI创作的基石和“饲料”,人工智能作为深度学习的主体,需要接受人为提供的海量预处理后的数据并进行机器阅读(Machine Reading),即对知识和信息进行数字化处理和存储,以满足人工智能交互式创作的需要。AIGC获取训练数据是侵害他人复制权的行为,还是属于对数据的合理使用?这是值得探讨的问题。

一般而言,判断著作权合理使用的标准系“三步检验法”,即《中华人民共和国著作权法实施条例》第二十条所规定的:

“依照著作权法有关规定,使用可以不经著作权人许可的已经发表的作品的,不得影响该作品的正常使用,也不得不合理地损害著作权人的合法利益。”

首先,合理使用只能在某些特殊情况下使用,如《著作权法》列举的十二种情形;其次,不得与作品的正常利用相冲突;最后,不得损害著作权人的合法权益。不难看出,在著作权法“促进知识、鼓励创新”的立法目的体系下,是否对著作权人造成“实质性利益”损害(或者说是否取代原作品的使用),是判断合理使用的核心尺度。最高法也在《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》中指出:“在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素,如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用。”

如果我们将目光转向域外,我们会发现欧美发达国家已经通过成文或判例的方式,确立了人工智能数据输入过程中对于文本数据存储的合理使用规则。在美国谷歌图书馆案中,法院认为,使用越有转换性目的(Transformative Use),它越服务于版权法促进公共知识的目标,它越少可能性地形成对原始作品的替代。转换性使用趋向于有利于合理使用,因为它有些新的、不同于原作品的内容,因此服务于版权法有利于公共知识的最终目标。

由此可见,文本数据存储、挖掘是人工智能时代科研活动和商业开发的重要基础,如果认定数据输入不构成合理使用,机器智能产业发展便失去了合法性支撑,这有悖于著作权法的立法目的。正如有学者所言,为机器创作而输入数据,这些数据通常属于创作的主题、体裁、题材等思想范畴,而与作品的思想表达无关,很难认定侵犯原作品的复制权。

04 写在最后

未来时代著作权法的走向,将是工具理性和价值理性的统一。正如周鸿祎所说,用大模型来真正实现整个产业互联网向智能互联网、产业智能化的转移,将是创业公司的一个焦点,那么构建一种包容、开放的回应型著作权法体系,坚守立法目标、回应社会发展所需,或许是回答AI行业发展与企业合规相平衡之问的最佳回答。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。