征稿要求：

1．论文符合本刊宗旨与学术规范，具备较新的学术观点，使用较新的文献资料。评论性文章观点鲜明，语言生动，分析深刻，能够及时反映、探讨学界及业界的热点问题。

2．所投稿件为作者本人撰写并未曾在其他刊物公开发表过。

3．稿件一律用电子邮件附件形式发送到电子邮箱：guangdianyanjiu@yeah.net

4．附件请用Word文件，并注明文件名及作者名。

5．稿件篇幅：论文原则上以6000字以内为宜；评论文章控制在1500字左右。

6．稿件应注明作者的真实姓名、职称（职务或学位）及工作单位、详细通讯地址及邮编、联系电话（手机最佳）和电子邮箱。

来稿的处理流程是什么？

1．请勿一稿多投，也不要重复投稿。

2．收到稿件后，本刊编辑部认为符合要求或基本符合要求但仍需修改的，会主动与作者联系。投稿后30个工作日内未收到本编辑部处理意见的，可自行对稿件另作处理。

3．因经费有限，编辑部对特约稿件支付超标稿酬，一般稿件只能略付薄酬。

文章格式有什么讲究？

1．标题。主题用1号黑体；副题用3号宋体。居中。

2．作者姓名，用四号楷体，右对齐。

3．文本提要，小四号楷体，200字以内；关键词，小四号楷体，3-5个。

4．正文，用5号宋体。1级小标题用小4号幼圆体，居中；2级小标题用5号黑体，左对齐并缩进两个汉字；3级小标题用5号楷体，左对齐并缩进两个汉字。

5．鉴于本刊区别于其他学刊图文特色建议作者供稿时提供文章相关图片及作者照片，并确保图像精度。

6．文末标出作者单位及职称（或学位、职务），若有多个作者，用分号隔开；

7．注释一律采用尾注形式。注释二字，用小5号黑体。注释条目各项顺序依次为：作者姓名、冒号、《文章标题》、逗号、《刊名》某年第几期（《书名》第几页，某年版），用小5号楷体。

8．为节约篇幅，一般采用注释形式的文章，不再单独一页设立参考文献。

首页 > 最新目录

音乐领域生成式人工智能的版权问题研究

2023年以来的新一轮人工智能（AI-Artificial Intelligence）技术发展浪潮席卷全球，生成式人工智能快速发展并逐步走向社会应用，已经渗透到包括文本、图像、音频、视频等内容产业，既给内容产业带来新的机遇，也带来了新的挑战。在版权领域，产业界、司法界、学术界关于AI的话题被热烈讨论，焦点问题有两个：其一，人工智能生成内容（AIGC -Artificial Intelligence Generated Content）是否受著作权法保护。其二，训练人工智能使用作品是否应当取得著作权许可并支付费用。关于这两个问题，学术界有完全相反的意见，讨论激烈，尚未形成共识。在司法界，笔者收集的国内生效判决共8个[1]，观点和裁判结果同样存在较大差异，主要涉及美术作品和文字作品。对这两个问题的学术研究，同样多以美术作品和文字作品作为实例，音乐领域相关的研究还较少。由于音乐作品/录音制品与其他作品相比有自身的特点，笔者试着从音乐领域切入，通过介绍音乐领域人工智能发展，结合中国音像著作权集体管理协会在音乐领域内做的相关调研结果，对上述版权领域内的焦点问题进行探讨，希望能管中窥豹，为各界提供新的信息、启发新的思考。

一、音乐领域生成式人工智能的发展现状

音乐领域生成式人工智能指能够生成音乐作品（词作品、曲作品）或者音乐录音制品功能的人工智能。常用的有两类：一类是主要用于生成歌词，目前的大语言模型如ChatGPT、Deepseek、豆包等都具备较为成熟的生成歌词功能。这类大语言模型主要用于生成文字作品，生成词作品实际上是属于生成文字作品功能的一部分。另一类是以音乐作为核心功能的人工智能（以下简称：音乐AI）。用户将文字提示输入大模型，大模型在几分钟之内同时完成“词、曲、演、录”，向用户提供歌词以及音乐音频文件。部分音乐AI也支持用户上传音频、图片、视频作为提示。这类音乐AI国外具有代表性的有SUNO、ODIO，国内具有代表性的有海绵音乐、MUREKA(天工SKYMUSIC)、网易天音等。音乐AI功能在音乐领域的功能更为丰富、全面，是本文研究的重点。

（一）音乐AI的工作原理

要研究音乐AI的版权问题，首先应了解音乐AI的工作原理。以SUNO为例，音乐AI在训练时，首先要把海量的音乐作品/录音制品复制到数据集，将音乐的特征转化为（Token）即模型可以理解的最小单位，这些特征包括旋律、节奏、速度、和声、复调、调性、歌词、段落、唱腔、音色、情感、流派、音高、歌手风格等，使用大量不同类型的音乐作品/录音制品对模型进行训练，让模型挖掘其中的规律，掌握各种音乐元素之间的关联和模式。当AI用户输入文字提示（部分音乐AI支持使用音乐音频、图片、视频作提示），音乐AI对于文字信息进行分析处理，构建音乐结构，生成旋律，添加和声和编曲，合成人声，再进行处理和优化。如图：

音乐领域.png

从过程上来看，AI生成的音乐，取决于三个要素：数据集、大模型算法、用户的提示。任何一个单一要素都无法决定使用者使用AI所生成的内容。

（二）常用音乐AI的试用结果

2025年6月，笔者分别对SUNO、UDIO、MUREKA、海绵音乐和网易天音五款常用的音乐AI进行了试用，内心预设目的是：生成一首与《让我们荡起双桨》[2]相同或尽量相似的歌曲。而后，笔者在各音乐AI输入下提示词：一首轻快的中文童声合唱。一群儿童在湖面上划船，湖面波光粼粼，远处有美丽的白塔。风格轻快、温暖、积极向上。不同AI的主要功能如下表（因文字无法展现AI生成的曲和录音制品，仅以歌词生成结果为例）：

通过试用可以发现，输入同样的提示词，每个音乐AI都生成了不同的音乐作品/录音制品。不仅如此，将同一个提示词多次输入同一个音乐AI,得出的音乐作品/录音制品也不一样，如：

75(2).png

部分的AI服务者开始向提供者向用户收取订阅服务费, AI用户需付费能享受更多权益，比如：更多的生成次数或更丰富的功能。此外，AI服务者在其《用户协议》等格式合同中对用途、收益甚至所谓“版权”做了约定。主要条款摘录如下：

（三）AI在音乐产业产生的影响

2025年6月，中国音像著作权集体管理协会以“AI对音乐产业影响”为题目向121名音乐行业从业者进行调研，35.54%的音乐行业从业者使用过AI用于音乐创作/制作。其中，最主要的用途是“AI歌词生成”（58.14%）以及“输入文字提示或其他素材，使用AI自动生成一首完整的歌曲或乐曲”（53.49%）。

其中47.93%的受访者认为AI超越大部分人类创作，但缺乏人的思想和温度，无法超越高水平作者。

调研显示，音乐从业者认为：AI带来的主要正面影响是降低创作门槛（73.55%）和减少制作成本（76.03%）；AI带来最主要的风险是音乐内容同质化、大众音乐审美退步（78.51%）以及AI挤占音乐市场造成版权费流失（66.12%）。

77(2).png

二、人工智能生成内容是否受著作权法保护——以音乐领域为例

《著作权法》第三条规定：本法所称的作品，是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。正如李琛教授所言：我国著作权法上“能以一定形式表现的智力成果”就是“表达”[3]。表达是作者将“思想”运用文学、艺术和科学等符号进行的外化。从音乐AI的工作原理和笔者试用各类音乐AI的结果来看，可以得到以下结论：

（一）AI的使用者本质上是选择者，选择者不是作者

在音乐AI的工作原理中我们可以看出，AI的使用者通过使用AI能得到什么内容，是由三个要素决定，即数据集、大模型算法、用户的提示指令。打个比方，数据集就像一个巨大的积木池，里面堆满了各种各样的积木零件，大模型的算法相当于组合积木的方法。当AI的使用者给AI一个指令“我想要什么……”，AI会在海量的积木池子里挑选积木，按照学习过的规律进行组合，提供给AI用户。如果AI用户不满意，可以再来一遍，或者换一个AI。因为积木池子很大，零件细小，组合的选择多到用户无法预知，有一种“创造”新事物的幻觉，但事实上选项数目庞大但始终是有限的。假设数据集里没有复制过摇滚乐风格的音乐作品，那么就无法根据AI用户的提示和描述生出“摇滚乐”，无论这种描述有多么详细和精确。因此AI的使用者是选择者，具体体现在：输入指令时候，是让算法为AI用户做初选；生成内容以后，用与不用，自己做一次复选，不论经历多少次提示词的调整，“选择”这个行为的性质并没有发生改变。选择者不是作者，AI的使用者的“选择”，不同于美术作者选择画笔还是绘图软件，因为画笔和绘图软件是工具，不是“成果”本身；也不同于美术作者选择颜色和线条，因为画笔和线条是艺术的语言符号，也不是“成果”本身。AI用户使用AI生成内容是直接选择了“成果”，他既没有“创”的过程，也没有“作”的空间。

（二）AI用户使用AI生成的不是AI用户思想的“表达”

在试用音乐AI过程中，笔者有明确的创作预期，脑海里是《让我们荡起双桨》歌词和旋律，希望生成与《让我们荡起双桨》相同或尽量相似的歌曲，并将这种预期变成文字描述输入AI，结果得出的结论与预期相去甚远。有人可能会质疑笔者没有写出精确的“提示词”，但这类验证很容易，试试便知道：没有人能够通过音乐AI去生成脑海里的旋律。原因在于，音乐领域的“思想”是不能用文字去表达的，其他的声音、图片、视频也不能表达“音乐”，音乐是从音乐家的脑海外化到记录音乐的符号，这之间用多精确的文字也无法转述。

从反面推理，如果文字可以转述音乐，那么笔者用同样的文字转述“音乐思想”，那得到的结果应该是相同的，但结果是：一模一样的文字转述过去，不但不同的AI生成的内容不同，同一个AI生成的内容也不同。这说明，文字无法转述音乐，文字是AI使用者给AI程序用于计算的一个参数，在参数下生成的内容已经与AI用户的“思想”脱节，因此，生成的内容不能预判，当然也不会唯一。

（三）AI服务者提供者亦不能成为生成内容的作者

《著作权法》保护的作者是创作作品的自然人，法人要成为作者，必须符合《著作权法》第十一条规定，即：由法人或者非法人组织主持，代表法人或者非法人组织意志创作，并由法人或者非法人组织承担责任的作品，法人或者非法人组织视为作者。AI服务者提供者是AI服务的提供者，其意志是向用户提供AI生成内容服务，而不是体现于AI生成内容本身。显而易见，在现行著作权法条件下，AI服务者提供者不能成为《著作权法》保护的作者，不能享有AI生成内容的著作权。

（四）AI用户和AI服务者提供者不需要《著作权法》的额外激励

AI服务者提供者已经建立有效的利益回报机制。例如，SUNO在2024年10月推出了付费规则，有专业版（10美元/月）、高级版（30美元/月）等多个服务套餐。根据Sacra的估计，Suno AI在2024年的年度经常性收入为4500万美元[4]。公开信息显示，截至2024年，Suno AI的用户数从 1000万增长到了2500万。AI服务者提供者的获利应当基于其能够提供的技术服务，而不应当基于其生成的内容的版权收益，事实上也正是如此，给予AI服务者提供者《著作权法》上的激励既不存在正当性也不存在必要性。

AI的用户从生成式AI中获得的好处包括：获得能够使用的内容、辅助自身创作、娱乐以及延伸的社交等。AI用户并不会因为没有获得著作权保护而放弃使用AI。更重要的是，AI用户不会因为使用AI而提升构建“美”的能力，为社会累积精神财富,从而促进文化和科学事业发展，因此在未来《著作权法》修订时，依然不应当成为著作权法保护的激励和保护的对象。

三、使用作品/制品训练人工智能是否应当取得著作权许可并支付费用

（一）现行《著作权法》条件下，训练人工智能使用作品/制品，应当获得许可并支付使用费

从上述音乐AI工作原理来看，要形成数据集，必然存在复制音乐作品/录音制品的行为用于AI训练的行为，按照《著作权法》第十条关于音乐作品复制权以及第四十四条关于录音制品复制权的规定，应当取得权利人的许可并且支付费用。有些学者认为，人工智能使用已有音乐作品/录音制品进行训练符合《著作权法》第二十四条合理使用的规定。笔者不赞同这种观点，著作权法第二十四条关于合理使用采取了列举法，使用作品/制品用于训练人工智能在列举情形之外，不能认定为属于合理使用。

（二）未来，《著作权法》依然不应免除AI服务者提供者支付著作权使用费的义务

随着AI技术的进步，AI生成的数量庞大的音乐内容将充斥市场，而音乐市场的消费并不会因此而扩大，词曲作者、录音制作者都面临收入减少的问题，在前述中国音像著作权集体管理协会所做的调研中，受访者中59.5%的人认为，未来五年AI发展会给词曲作者带来20%以上收入的损失，仅有6.61%的人认为不会造成收入减少；受访者中53.73%的人认为，未来五年AI发展会给录音制作者带来20%以上的收入损失，仅有9.92%的人认为不会造成收入减少。

正如前述调研显示，47.93%的受访者认为AI超越大部分人类创作。大部分人类创作作品/制品的数量、效率都将无法与AI生成内容抗衡。如果多数词曲作者/录音制作者都面临生存危机，那么《著作权法》鼓励创作和传播的目的也将落空。而AI学习训练的市场需求，可能成为创作/制作者，尤其是学习成长中的中腰部创作/制作者重要的收入来源，因此现在和未来，都不应当将AI的训练划入合理使用范围。

（三)应当构建有效机制，能够让人类创作者从AI训练中获得合理回报，建议引入补偿金制度

AI生成内容将大量挤占人类作品的市场空间，音乐作品/录音制品的权利人的收入会发生严重萎缩，AI训练使用音乐作品/录音制品，作者/制作者应当获得公平回报。面对AI的海量学习训练使用，AI服务者提供者难以一一获取权利人的授权，权利人面对隐藏在程序背后的学习训练，难以发现侵权、获取证据以及进行维权。要鼓励AI科技的发展，应当尽量降低交易成本，减少交易的限制，明确交易成本预期。要让权利人获得合理回报，应当减轻权利人主张权利的成本、简化主张权利的程序。补偿金机制是较为理想的选择。补偿金制度起源于德国，此后大约有40个国家已经建立了版权补偿金制度。以美国为例，美国于1992年公布《家用录音法案》规定：数字录音设备或数字录音储存媒介物的生产商和进口商均须缴交一笔法定授权金。其中，制造或进口数字录音设备的，每卖出一台数字录音设备，须缴交该设备销售价２％的使用费给版权所有者；制造或进口数字录音储存媒介物的，则每卖出一款数字录音储存媒介物，须缴交该媒介物销售价３％的使用费给版权所有者。其中的逻辑是，当一个行业的发展不可避免地损害权利人的权益时，权利人难以控制自己的权利，则采取一个概括性的一揽子付费的形式对权利人进行补偿，由著作权集体管理组织向权利人进行分配。权利人面对AI学习训练的情况与此类似，通过补偿金制度，AI服务者提供者使用作品进行训练更为便利，成本可控，权利人则可以高效地取得经济回报，免去谈判、监测、固证、维权等各种交易负担，尽快建立起良性的交易机制。

四、结语

《著作权法》第一条开宗明义：为保护文学、艺术和科学作品作者的著作权，以及与著作权有关的权益，鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播，促进社会主义文化和科学事业的发展与繁荣，根据宪法制定本法。这一条是《著作权法》的立法目的，一直以来各界关注的重点在“鼓励作品的创作和传播”，后半句“促进社会主义文化和科学事业的发展与繁荣”因为是“鼓励作品的创作和传播”的当然结果往往被忽视。在AI时代，“促进社会主义文化和科学事业的发展与繁荣”——这一《著作权法》最终目的应当被重视和重新思考。当不仅仅是人类能产生内容时，应当回到《著作权法》的出发点，鼓励谁？激励谁？才能推动促进社会主义文化和科学事业的发展与繁荣。

人的创新能力是所有内容生成的源泉。正如李飞飞在《我看见的世界》中说“科技革命必须深深根植于人类奋斗的基础之上，必须尊重全球社会的集体尊严，必须始终牢记自己的起源”[5]。AI时代应当更加重视和加强对人类创新能力的保护。社会文化和科学事业的发展繁荣依赖于人的创新力，“创新”是人类独有的，只有保护好人类的创新力，才会不断有人愿意投身于创新和创造，文明的高塔才能不断累积、上升。

（作者系中国音像著作权集体管理协会副总干事）

【1】笔者所指8个案件包括：

菲林律师事务所诉百度（菲林案）(2019)京73民终2030号

深圳腾讯公司诉上海盈讯科技有限公司（梦笔案）(2019)粤0305民初14010号

李某诉刘某侵害作品署名权、信息网络传播权纠纷(春风案)(2023)京0491民初11279号

上海新创华文化发展有限公司诉广东某公司（广东奥特曼案）(2024)粤0192民初113号

上海新创华文化发展有限公司诉杭州水母智能科技有限公司（杭州奥特曼案）（2024）浙0192民初1587号

林某诉江苏常熟某房地产公司（江苏伴心案）（2024）苏0581民初6697号

王某诉武汉某科技有限公司案（全国第三例AI文生图案）（2024）鄂0192知民初968号

丰某诉张家港东山文化传播有限公司、张家港神州机械有限公司（幻之翼案）（2024）苏0582民初9015号

【2】《让我们荡起双桨》是一首经典儿歌，由乔羽作词，刘炽作曲。

【3】李琛，《重思“表达”概念的规范意义——兼论人工智能用户指令行为的法律性质》[EB/OL],《知识产权》，2025年6月9日，[2025年6月15日]。https://mp.weixin.qq.com/s/756XHMBAMu0lsnAD7jF8Ag

【4】Sacra是一家美国公司，总部位于纽约，为私募市场提供研究信息。

文中引用数据来自https://sacra.com/c/suno/

【5】李飞飞.《我看见的世界——李飞飞自传》[M].1版，北京：中信出版集团股份有限公司，2024：12页