李开复的零一大模型套壳LLaMA算抄袭吗？

2023-11-21 09:33:00 - 界面新闻

近日，李开复投资的零一万物公司被曝出其大模型“Yi”使用了Facebook母公司META的LLaMA大模型（全称为“LargeLanguageModelMETAAI”）的开源代码，对外却没有提及。套壳却不说明的做法引来了大量质疑。对此，该公司致歉称：正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中。该公司负责人表示公司不存在抄袭问题。今天就来跟大家聊聊，法律上，这种行为算不算抄袭？法律后果还有哪些？

先说结论。我国《著作权法》规定：署名权，即表明作者身份，在作品上署名的权利。所谓的抄袭，就是侵犯署名权的行为。零一万物的软件使用公司的源代码却不标来源，让别人看起来这部分内容是他们自己开发的，确实涉嫌侵犯署名权，也就是涉嫌抄袭。哪怕是他们是疏漏造成的，侵犯署名权也没跑。至于法律后果，我们要切换一个视角，要从LLaMA的著作权人META公司看，他们被侵了哪些权，就知道了。

META公司虽然公开了LLaMA2的代码，但其在软件协议中做了多项保留，摘几点大家看看：

以上条款是否有效？当然有效。LLaMA 2的软件著作权属于META，公开源代码时对权利进行保留，只要不违反法律规定，也是其合法权利。另外，笔者查了一下，OpenAI用户协议和Claude用户协议中均含有不得用其服务改进竞争对手产品的条款，但GoogleBard和文心一言的用户协议则没有此类条款。

因为对授权进行了限制，所以虽然META公开了LLaMa2的源代码，但开源软件机构OpenSource并不认为这种做法属于开源，他们还特地发了个文章做了个说明：因为开源许可证不应歧视个人、团体或工作领域，而META对LLaMa模型和代码的许可时对月活超过7亿用户的开发者，以及用LLaMa改进其他大型语言模型做了授权限制，因此不符合开源标准。

如果没有公示的，可以视为被授权人没有满足授权条件，所以其二次开发及发布均涉嫌侵权，二次开发侵犯META公司的软件修改权，发布修改后的源代码及编译后的目标程序，则侵犯META公司的软件信息网络传播权。

同时，如果零一万物公司不承认套壳的，也就不能算LLaMA2的衍生作品，会同时违反“不得使用将LLaMA用于改进任何其他大型语言模型，但LLaMA2或其衍生作品除外”的用户协议规定。

如果第三方开发者不了解情况，使用了零一万物公司隐匿来源的代码做再次开发的，同样会因为受零一万物公司的牵连，面临侵权法律风险。定性上，零一万物公司的法律风险，第三方开发者都有，只是如果不明知，侵权的性质就没有那么严重。

对零一万物公司侵权代码再次开发（含三次开发、四次开发……）的作品代码如果包含LLaMA2代码的，首先会侵犯META的署名权，其次是META公司的软件修改权，发布修改后的源代码及编译后的目标程序，则侵犯了META公司的软件信息网络传播权。

LLaMA英文对应的是一种可爱的动物——美洲大羊驼，也就是中国网民俗称的“草泥马”。中文俗称虽然有点粗俗，但LLaMA的软件协议虽然对使用有限制，但规定其实并不严厉，如果像笔者之前介绍的《用GitHub上的开源代码训练人工智能违法吗？》一文中提到的，是用了GPL协议项下的代码而不标识的，法律风险会更大。总之，我们对公开源代码软件的态度应该需要更加严谨，要用别人的代码，就应该遵守别人的开源协议，否则，不但自己可能侵权，还会连累用你产品开发衍生产品的人。

（本文仅代表作者观点）