本文根据中国台湾智财局著作权组视察员陈俞安所著《生成式AI与著作权议题之国际趋势》第二部分“各国AI政策介绍”内容进行汇编——
生成式AI(人工智能)对各行各业带来巨大影响,尤其对创造和创作领域的影响深远。因此,各国和各地区对生成式AI的法律规制也日益重视,其中,尤以著作权法(版权法)的规制为重点。本文介绍了各国和各地区对生成式AI的著作权法规制的相关政策以及对未来提出展望和趋势预估,期望对读者有所助益。
一、欧盟(EU)地区
欧盟地区出台的涉及生成式AI的法规主要包括:(1)2019年3月通过的《数字单一市场著作权指令(Directive on Copyright and related rights in the Digital Single Market,以下简称CDSM指令)》;(2)2024年7月12日欧盟发布的《人工智能法(Artificial Intelligence Act,以下简称AIA)》;以及(3)德国法院作出的判例(德国汉堡地方法院 2024年9月27日在Kneschke诉LAION案作出的判决)。
其中,CDSM指令第3条规定了科研豁免行为,即“研究组织或文化遗产机构”为“科学研究之目的”进行数据探勘(mining)之规定,在适用主体上强调非营利性及公益性,并限于“有合法接触权限(lawfully accessible)的著作”,由于该规定适用范围相当有限,因此权利人不得以契约条款禁止上述数据探勘行为;而CDSM指令第4条规定不限非商业目的之数据探勘权利限制规定,不限适用主体,同样限于“有合法接触权限的著作”,且权利人可以保留其作品用于数据探勘用途的权利,即“选择退出( opt-out)”。
其中,AIA已明确表示生成式AI的开发与训练属CDSM指令第4条规定的范畴,但是须尊重权利人选择退出之意愿,当权利人依该条明示退出时,通用AI模型 (依AIA前言第97、99项,通用AI模型系指透过无监督学习或强化学习等方式训练大量数据,以胜任执行各种不同任务的能力之模型。大型生成式人工智能模型即通用人工智能模型的典型例子)提供者需要获得权利人的授权后才能利用(AIA前言第105项)。
值得注意的是,德国地方法院已有判决认为,为生成式 AI 模型训练用途重制他人图片建置数据集之行为,符合德国著作权法第60d条(依据CDSM指令第3条所增订)“为科学研究目的之资料探勘”权利限制规定,且法院另补充说明,认为被告重制行为亦符合德国著作权法第44b条一般数据探勘之目的(同CDSM指令第4条),但因权利人已依该条规定声明退出,故无法适用。
然而许多权利人团体(组织)担心创作内容被用于训练资料影响权益,纷纷表达了“退出”AI训练数据使用的意愿(如索尼音乐集团、德国著作权集体管理组织GEMA等),对于AI开发商主张前述数据探勘权利限制规定将造成不小的冲击,恐仍需积极地与权利人协商,探索新的合作模式,以取得高质量的训练资料。至于哪些选择“退出”方式与技术符合法律要件仍未明确,OpenAI、Google及Apple公司陆续开发可自动判断网站退出信息之爬虫工具(需以robots.txt等机器可读形式明示退出数据探勘之用途);微软则表示须依该公司规定的形式表达对“特定模型”的退出(权利人需重复为不同训练模型“选择退出”,耗费心力);有些公司甚至没有提供“退出”的选项(Meta承认了脸书IG 贴文全被拿去训练AI),前述德国地方法院判决则认为不需要求特定技术格式,以纯文本声明亦符合退出声明。为解决上述AIA实施面临的问题,需要标准化相关规范(如“退出”方式)作为实务运作之依据,欧盟AI办公室爰于法案通过后,陆续寻求包括AI模型提供者、民间组织、学术界及相关产业等近千名利害关系人召开数次会议,磋商具体可行的行为准则(code of practice),预计将于2025年5月发布,以确保模型提供者落实相关义务。
二、英国
英国早在2014 年就于《著作权、设计及专利法》第29A条规定数据探勘权利限制规定,但仅限于非商业之研究目的,适用范围相当有限。近年英国政府曾讨论为因应AI发展趋势,修正放宽可用于商业用途,但是遭遇音乐、出版等创意产业强烈反对而撤案。在此同时,英国人工智能和知识产权部长认为透过立法来平衡AI开发商和权利人的利益的任务艰巨,不如推动AI产业及创意产业间之协议,建立自愿性著作权行为准则(a voluntary AI copyright code of practice),让AI开发商取得训练模型之高质量数据的同时,内容创作者也能得到充分的补偿,但2024年2月该自愿性协议因无法取得产业间的共识而暂缓推动。 2024年7月新政府(工党)上任后,强调AI产业创新对经济发展的重要性,为打造有利AI产业发展之法律环境,爰于同年12月进行为期2个月的公众咨询,讨论是否参考欧盟CDSM指令规定不限非商业目的之数据探勘权利限制规定,并提供权利人选择退出之机制,但此提案仍受到音乐产业强烈反对,尚待协商寻求共识。与此同时,英国政府推出《AI行动计划》,规划与国家档案馆、大英图书馆及英国广播公司(BBC)等机构合作,建立无著作权疑虑(copyright-cleared)之内容数据库,以推动大规模国际授权,则系在遵循现行著作权法之前提下,将高质量数据释出,以促进AI创新与应用发展。
三、美国
美国虽然没有针对资料探勘制定例外规定,但著作权法规定第107条为评论、研究等目的合理使用著作,不构成著作权侵害之概括合理使用(fair use)规定,其判断应考虑四个要素:1、利用之目的与性质,包括系商业性或非营利目的;2、著作的性质;3、所利用之质量及其在整个著作所占之比例;4、对著作潜在市埸或价值之影响。其中又以第一个要素“利用目的与性质”是否具有“转化性”为判断合理使用的关键考虑,也就是对著作的利用添加新的要素、具有与原著作不同利用的性质或目的,且不致造成替代原著作的使用,此种“转化性利用(transformative use)”较容易被认定为合理使用。
而在科技日新月异的时代,利用他人著作是否构成“转化性利用”而有美国著作权法第107条概括合理使用之适用,是美国诉讼中的重要争点,美国第二巡回上诉法院就Google Books案之判决,为数字技术合理使用他人著作之经典案例,法院认为Google将书籍数字化,显示片段讯息以供群众检索、浏览,是一种合理使用,且具有高度转化性,增加了大众认识该等作品的机会,而非向公众提供原作品的实质替代物,且增进公共利益,符合美国著作权法第107条概括合理使用规定,亦是目前AI开发商在辩护中的主要依据之一。
然而从2023年美国最高法院在最新的安迪沃荷( Andy Warhol)案之判决观之,即使在原作品中添加新的意义而构成“转化性”使用,法院认为仍然必须衡量二创作品“利用原创作之目的与性质”与原创作者间的衡平利益。因此,生成式AI之被告生成内容与原告作品如具有相同或类似的使用目的、可能取代原作之市场,而被告的大量重制他人著作却未见对原作之回馈,或欠缺公共利益等,似不当然能主张转化性的合理使用。美国版权局在2024年7月发布的政策建议报告亦指出,使用艺术家作品训练AI模型,以模仿或生成类似风格内容之情形,不排除作者请求损害赔偿的可能性,强调AI技术发展与创作者权益间衡平之重要性。
关于未经授权利用他人著作训练AI模型的诉讼, 2020年曾有科技公司搜集了知名法律信息检索平台之判决摘要训练AI搜索引擎被该平台提告,美国地方法院于2023年9月之中间判决提到,如果模型训练过程中的复制只是为了分析语言模式,以开发“全新的”、具竞争性产品的过程,且不会包含或输出侵权内容,则可能属“具转化性的中间复制”(transformative intermediate copying)而构成合理使用,并分析未来考虑AI训练数据合理使用的核心问题包括允许AI使用受保护著作进行训练之转化性是否够大、是否带来公共利益,以及对原作市场是否造成阻碍等。而本案于2025年2月作出判决(仍可上诉),法院认为被告将摘要作为法律研究工具之目的与原告相同,不具转化性,且意图开发市场替代品与原告竞争,未能增进公共利益、损害原告授权他人训练模型的潜在市场,因此不构成合理使用。本案虽仅针对“非生成式”AI 进行审理,但其分析仍为未来法院审理AI相关侵权诉讼提供重要指引。
各国于2023年至2024年间已有数十件利用他人著作训练AI模型相关著作权侵权诉讼,因此法院在个案将如何诠释、衡量此些关键要素,值得密切关注。
四、日本
日本于2018年修订著作权法第30条之4关于数据探勘权利限制规定,“不以享受著作中表达的思想或情感为目的”,可在“必要范围内利用著作”,但不得“不当损害著作权人利益”,因此数据探勘用于生成式AI学习,原则上将不构成侵权,看似较其他国家规范更加宽松,但对创作人权益影响甚大,因此日本2023年10月起组成“AI时代的知识产权研讨小组”陆续就生成式AI发展过程之问题进行讨论,明确列举多项需例外取得授权之情形,故利用他人著作于训练AI模型仍须谨慎。
如具有“以享受为目的”而不适用上述限制规定之情形,包括为回答使用者提问之检索增强生成技术(Retrieval-Augmented Generation,RAG),以及仅使用特定创作者之作品进行额外学习等情形;规避付费数据库以获取数据,则属“不当损害著作权人利益”而被排除适用。此外,如果特定AI产品生成侵权内容的频率很高,那么该AI产品提供者被认定为侵权主体的可能性将会增加。
日本作为全球动漫产业大国,包含漫画家、作曲家、插画家、摄影、图书等内容创作者对于生成式AI可能侵害其著作权益表达担忧,因此政府为减少创作者顾虑,持续梳理AI发展过程之著作权问题并针对不同利用主体提供应对方法,从法律、技术及契约三方面着手,例如建议“AI开发及提供者”于训练阶段检视是否有“以享受为目的”之情形(法律面)、于生成阶段采取过滤措施防止生成与现有作品类似的作品,降低被认定为侵权主体的可能性。同时也建议“权利人”实施可防止AI侵权学习之措施,包括使用“robots.txt”等机器可读格式等限制数据被搜集(技术面)、透过账号和密码等方式限制他人接触、或将作品整理为数据集有偿提供权利人进行追加学习等(契约面)。
此外,日本内阁府指出上述法律、技术及契约三者间之相互关系,并考虑到每种方法都有其局限性,因此三者应发挥互补作用,并应以动态的方式应对生成式 AI 可能带来的侵权风险 38,值得参考。
五、韩国
韩国国会议员曾于2021年提出著作权法修正草案,参考日本立法例,增订第43条数据探勘限制规定,即“非享受著作所表现的思想或感情之目的”,为“生成追加性的信息或价值”,可就合法接触之著作在必要限度内重制、公开传输,强调就既有著作之加值利用,以符合产业发展需求,惟该草案因国会任期届满而于2024年5月失效。有学者认为韩国2011年增订之著作权法第35-3条概括合理使用规定或可作为替代方案,然而韩国在概括合理使用原则的司法判决积累远不如美国,将使得AI开发商利用他人著作训练模型时,面临相当大的不确定性和挑战。
为应对AI利用著作训练模型之争议,韩国著作权委员会邀集学界、法律专家、技术专家及利害关系人组成“AI著作权制度改善工作小组”,并于2024年1月发布“生成式AI著作权指引”,主要系在现有法律制度下如何避免侵权提供建议,首先,AI开发商在AI学习阶段,建议支付权利人足够的报酬、使用公共领域作品或其他方式,确保训练数据之合法权限。其次,在AI生成阶段,建议采取过滤措施来防止生成与现有作品相似的内容。而著作权人如不希望作品被用于AI模型训练,可透过网站使用条款或机器可读格式声明退出,另建议用户输入指令时应避免诱使AI生成侵权内容,并不得发布可能侵权的AI生成内容。
此外,为确保AI开发商能够合法利用他人著作训练,前述工作小组于2024年6月28日提出建议,认为政府或学术机构可在著作权集体管理团体与AI开发商之间的谈判授权过程担任中介角色,并可考虑增订资料探勘权利限制条款,以促进对著作权保护内容的使用,至于生成式AI开发商如何揭露AI训练所使用的内容清单以满足透明度义务,则仍在研析中。另一方面,为促进AI技术产业发展,韩国国会于2024年12月通过由科学和信息通讯技术部提出之“AI发展和信任建立基本法”(下称韩国AI基本法),其中为解决AI开发商合法取得训练资料之难题,该法第15条24明定政府可自行或指定特定组织建立数据提供系统,促进系统数据之搜集、管理、流通与利用,并可针对使用系统数据者收取费用,以确保系统的持续运作与公平性。但是韩国AI基本法于2026年1月始生效,能否成功为 AI 开发商提供合法且稳定的数据源,解决数据取得的挑战,仍有待进一步观察与评估。
六、新加坡
新加坡于2021年修正著作权法,其中第244条数据探勘权利限制规定,明定包含“为资料探勘准备著作(preparing the work)”(例如将原始数据格式化或转换文件格式),以及为数据分析目的有关的合作研究或学习,得向公众传播所重制之著作,且限于“合法接触之著作”,条文还特别举出“规避付费机制”或“违反数据库用户条款”作为不适用本条要件之反面案例。然利用来源如为非法重制物,在“仅为本条所定数据探勘目的之必要”情形下亦有本条款之适用,可见新加坡资料探勘权利限制规定在要件上较为宽松,且根据同法第188条规定,权利人不得另以契约条款“退出”上述资料探勘权利限制用途。不过,新加坡2024年发布之“生成式人工智能模型治理架构(下称 AI 治理架构)”仍提到应促进利害关系者间公开对话,以衡平利益之方式解决利用他人著作进行模型训练之争议。
七、中国香港
中国香港政府为提升对AI技术发展之保障,计划于“版权条例”制定新的数据探勘权利限制规定,同时试图维护著作权人与利用人间的利益平衡,针对数据探勘、用于提升计算机程序效能的计算机数据分析及处理(如AI模型的开发、训练、提升)之情形设定要件,包括 1、限于“合法存取之著作”;2、若存在可用的授权方案或著作权人已明确保留其权利(即选择退出),则该数据探勘活动将被视为未经授权;3、对进一步传播、散布、经销在该等权利限制规定下制作的重制物附加限制。
为确保法规修订能兼顾公共利益并充分考虑各界意见,香港政府于2024年7月展开为期两个月的公众咨询。然而目前仍未正式发布最终修订版本,显示不同利害关系人之修正建议,仍在讨论协商阶段。