张 平
摘 要:党的二十大报告强调,中国要建设具有全球竞争力的开放创新生态。开放创新是科技创新的重要源泉,智能制造更离不开开放创新。随着开源软件和硬件在多领域的广泛应用,知识产权新类型法律纠纷有所增长,层出不穷的风险问题逐渐暴露,建立自主可控的开源社区、完善开源知识产权和法律体系面临数据开放、标准协同、商业秘密泄露、著作权侵权、反垄断等诸多现实挑战,亟须完善开源许可的相关技术标准和法律法规,推动国产开源软硬件产业稳步发展。
关键词:开源许可证;数据开放;知识产权保护;法律纠纷
党的二十大报告强调,中国要建设具有全球竞争力的开放创新生态。开放创新是新时代科技创新的重要源泉,智能制造更离不开开放创新。无论是开放专利,还是软件和硬件相结合的开放,以及其他知识产权开放问题,都与开放创新模式有关。如果我们建立以开放创新为主的生态,那么软件开发就不仅仅是从他人的开源社区下载和使用,相关的法律法规和政策也不能仅仅是学习和借鉴,而是一定要有自己的东西,才能构建生态,否则我们就可能重蹈覆辙,就像芯片、操作系统等技术领域至今还没有形成自己的创新生态。
“十四五”规划纲要提出,支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。目前,已有高校开展实践探索构建自己的开放社区。但是,我们的原始资源怎么积累、开源社区的政策如何设置才能吸引开发者和贡献者来参与,这都是需要认真思考的问题。同时,开源相关技术和研发企业及其人员,也应提高相关法律法规意识,把风险扼杀在开始状态。
如今开放创新涉及的领域、行业更加全面,不仅仅在软件领域,开放硬件领域也开始了,但开放硬件和开放软件有许多不同。开源软件更多涉及著作权放弃或著作权保留,没有那么多金钱成本维护著作权的有效性;但开源硬件则意味着专利开放,专利是有申请和维护成本的,申请专利并开放给大家免费使用,那维护成本如何收回?对于使用者来说,也存在专利什么时候开始生效收费的担忧。例如,ChatGPT推出发展至今,已经呈现出闭源的倾向,原因是硬件和软件都在OpenAI公司的操控中。因此,对于开源社区的建立、开源知识产权和法律体系的完善,我们还有很长的路要走。本文基于现实案例,从数据开放、标准协同、商业秘密泄露、著作权侵权四方面简要分析开放创新模式下的法律纠纷新类型,以期为建立自主可控的开源社区提供参考和借鉴。
一是数据开放领域。开放创新,特别是智能领域的创新,大多离不开数据处理,尤其是在大数据经济或数据要素市场的构建中,数据要素的开放显得尤为重要。数据如果不开放,我们“寸步难行”,特别是人工智能软件就没有了大数据深度学习的条件和语料资源。中国作为人口大国、数据大国,有人口红利和数据条件,相关行业应该抓住这个实现大发展的机会。
数据开放共享存在的问题之一是,政务数据和公共数据在收集过程中有一定的特殊性或特权,但在应用方面的合规性要求却不亚于商业数据,比如税务、医疗、健康、交通等本由政府掌握的数据。这类数据的开发利用和共享,面临的第一个问题就是目的转用,一旦数据开放共享就脱离了数据收集的原始目的,而我国现行的《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》以及《中华人民共和国宪法》《中华人民共和国民法典》《中华人民共和国刑法》三大法都要求对数据使用须进行通知、告知等。此外,数据开放还需要保障多主体的权益,例如,允许消费者行使同意撤回权和删除权等。公共领域的数据使用可能较为宽松,而商业数据开放共享面临的问题则更多、更复杂,除了原始数据收集的合法性瑕疵考量外,数据的交易共享已经造成了目的转用,仍然会面临一定的合规成本和合规壁垒。尽管国家发展改革委已就数据交易出台相关文件,各个地方的数据交易中心也在如火如荼的建设中,但仍呈现出雷声大雨点小的局面,特别是数据大企业还在观望中。
数据开放共享存在的难点之二是,数据来源的合法性。数据如果不开放,人工智能就缺少学习语料。就像今天对ChatGPT原始数据源的质疑,许多公开的文字、图像、音乐、视频作品以及每个人上网搜索关键词所产生的数据都是大数据模型训练的数据源,而这些数据是有作者的,这些数据采集、使用如何合规,目前还没有明确界定,所以很多国家开始叫停此类应用。开放创新时代,软件和硬件开放遇到的问题还容易解决一些,而数据开放问题是很大难点,如果不能突破则寸步难行。
二是标准协同方面。无论是软件、硬件还是数据开放,最后都要通过一个共同的平台或机制实现“对话”,那就必须使用相同的“语言”或标准,在达成共识的前提下处理问题。未来在开放创新领域,技术标准是必不可少的,但是用国际标准还是国家标准,仍存在疑问。比如微软,它不采用国际标准,但从其自身市场地位和能力来看,其已经构成一种“事实标准”。ChatGPT也一样,如果未来我们都跟着ChatGPT大模型的技术路线走,那它就有可能成为该领域的事实标准,中国的同行业也不会例外。基于此,需要通过设置标准来实施局面控制。无论是开放政策声明,还是开源许可证,某种意义上都是一种合同约定,至少是具有承诺性质的约束,在法律上也有一定的效力。开放创新的规则制定非常重要,正是因为现有的规则不完善,以及对规则理解和认识的不准确,才导致了很多法律纠纷。
近年来,知识产权纠纷案例呈增长趋势,无论是民事还是刑事案件都有显著增长。早些年,开源许可证是开源社区信守的“法律”许可,但在今天开源社区不再是纯粹开放状态,存在着各种知识产权的保留条款,这一保留条款可以让所有的版权和专利权最后都能复活,即一旦终止授权,使用者就变成侵权,所以才会出现一系列民事和刑事案件。根据GPL3.0开源协议第8条“终止授权”的约定,授权人许可用户在遵守许可证规定的前提下行使某些权利,若用户违反GPL3.0开源协议的使用条件,其通过GPL3.0开源协议获得的授权将会自动终止,如此一来用户实施的复制、修改、发布等行为,将因失去权利来源而构成侵权。这一“权利保留条款”,导致使用者面临着来自开源社区的知识产权违约和侵权的风险。
三是商业秘密泄露纠纷。这涉及使用开源软件是否构成商业秘密侵权或构成侵犯商业秘密罪。商业秘密要具备秘密性、保密性和实用性三个特征,而开源资源本身就不具有秘密性,所以无论这个源代码资源是否对外发布或是被大众看到过,只要这个资源采用了开源许可证协议,那就意味着任何人想要修改、传播都不会构成侵权。
但实践中已经发生的此类案件表明,包含开源资源也有闭源资源的一项软件产品,极易导致商业秘密纠纷。比如一个技术员工带着原有的源代码成果(该软件有GPL3.0或2.0开源标识)应聘到新公司,并在此基础上完善开发了一套仅在公司内部运行且没有对外发布的软件产品,其再次离职后仍然继续使用这套软件代码,是否会对原公司造成商业秘密侵权呢?
这类案件的难点在于出示证据后,所谓的犯罪嫌疑人仍然不认罪,因为使用开源代码,又怎么能构成侵犯商业秘密罪呢?这里就必须提到,GPL开源协议最大的特点是具有“传染性”。GPL许可证的宗旨就是要将源代码转让给使用者免费使用和修改,故对被许可人修改后的产品有一定的限制,即要求被许可人对修改后的代码继续开源,继续对社会公众开放共享。因此,只要在一个软件中使用了GPL开源协议下的源代码,那么这个软件的衍生产品也必须采用GPL开源协议,做到开源且免费。在上述案例中,该技术员工的原就职企业充其量仅享有在源代码基础上所开发软件的著作权,而如果源代码是开源的,那么该企业同样负有将修改后的软件源代码进行免费公开共享等义务,除非软件中闭源和开源的部分是剥离的。带有“传染性”的开源软件代码能否构成商业秘密,这类“侵权”案件现在已经发生,且随着软件开发人员的广泛流动,大量的公司都面临着类似问题。开源软件的性质是一个法律问题,我们必须尽快厘清。而到目前为止,涉及开源软件的所谓的商业秘密侵权仍然是一道思考题,还没有明确的答案。
四是著作权侵权纠纷。我们以发生在广州知识产权法院的合同违约和侵权竞合案件——“济宁市罗盒网络科技有限公司诉被告福建风灵创景科技有限公司侵害开源软件‘VirtualApp’著作权侵权纠纷案”为例,该案一审判决书显示,GPL3.0 开源协议是一种民事法律行为,具有合同性质,可认定为授权人与用户间订立的著作权协议,属于《中华人民共和国合同法》的调解范围,因此一审判决认定被告违反开源软件许可证的侵权责任成立。
另外,应用程序编程接口技术的两端都是开源的资源,中间接口则是上锁的。过去有一种观点是,中间接口不应该受版权保护。但是,美国最高法院对“甲骨文诉谷歌案”的判决显示,中间接口技术是受版权保护的。美国最高法院认定,谷歌属于合理使用行为,因而免除其法律责任。但这并不意味着其他公司也因有能力达到“合理使用的情境和条件”,而自由使用中间接口技术。
除了知识产权违约和侵权风险,开源领域的反垄断风险也很大。开源许可证/协议已经在全球被广泛使用,其垄断地位比任何双向协议都要大得多,因而构成垄断的嫌疑也很大。比如产品搭售,就可能构成垄断行为。现在很多开源许可证已经通过开放源代码倡议组织(OSI)网站的开源认证,但它们又存在拒绝向特定公司开放的情况。这种情况下,开源协议许可方是否构成拒绝交易或滥用市场支配地位?OSI对开源软件有10个认定条件,其中第五条和第六条分别为不能歧视任何个人或团体、不能歧视任何技术领域。那么,安卓现在还是开源软件吗?如果不是,那它就不能再打着开源软件的旗号,而我们要不要将其从开源社区里踢出去?显然,还没有人质疑这些法律问题。华为被明确禁止使用安卓的开源软件,出于各种现实考虑的华为有选择起诉和不起诉的权利,但从法律研究的角度看,如果存在大量歧视,那就不能叫开源资源。
事实上,开源业已形成的更强大的市场控制能力,可能比闭源对于市场竞争和技术创新的伤害还要大,所以我们必须提高法律认识。今天,各种各样的开源和闭源结合在一起,会产生天然垄断优势,生成式人工智能的发展过程就是一个明显例证,这是资本驱动下的另一种竞争模式。早期的开源社区是软件爱好者的社区、俱乐部,而今天的开源社区均由大公司主导,我们不能被其表面的开源、开放和包容所迷惑,需要警惕开源社区开放包容与知识产权保护应用间的关系。
(作者系北京大学法学院、人工智能研究院双聘教授,北京大学知识产权学院常务副院长)