梅 宏
围绕社会经济领域逆全球化与信息技术领域大语言模型(LLM)和生成式AI(AIGC)这两个热点话题深入思考后,笔者产生了三点认识:一是信息技术生态必然是开源和闭源的交织,二是软件供应链全球化至少在基础软件领域开源是不可逆的,三是大模型和生成式AI的发展或将大幅度提升开源开发的质量与效率。
一、信息技术生态必然是开源和闭源的交织
开源和闭源同整个信息技术生态紧密关联。开源的发展一直是追求多方共赢的过程,开源的历史则是软件在创新自由与版权收益之间的博弈过程。开源虽然以理想主义为缘起,但在商业的蓬勃助力下汇聚群体智慧,成为开放创新的典范。
人们认为软件源代码一开始就是开放的,其实是后来Linux模式和其他自由软件竞争才导致“开源”的出现。可以说,没有商业就没有开源,从商业模式支撑的软件模式开发,到多种开源模式探索,再到企业积极拥抱开源和如今的开源全球化,开源已经形成多元化商业模式。
开源一定离不开理想主义,开源需要奉献精神。早期的开源都是围绕微软“帝国”周边,特别是操作系统生态。事实上,在每一个垄断性的软件领域都必然会有一群理想主义者投入研发一个开源版本,比如操作系统Linux、浏览器、办公系统、工业软件等,所以理想主义是激发开源的一个重要动因。不过,企业追求商业利益最大化也是合理的,否则就没有企业存在的必要了。但是显然,理想主义和商业利益需要平衡。
开源成为当前的热点,从微软对开源的态度就可以看出来。起初,微软是开源最大的反对者。2001年,微软CEO巴尔默说开源是癌症、是病毒,后来他却成为开源的积极拥抱者,甚至在开源社区收购了GitHub。让人疑惑不解的是,2022年,微软以OpenAI名义推出ChatGPT,尽管有消息称GPT3大概要开源,但微软为什么不直接开放呢?这也恰好说明一个道理,但凡能够在这个领域独享利益时,绝大多数企业或个人可能都会选择一个相对闭源的态度。所以,信息技术生态必然是开源和闭源的交织。
“抱团取暖”一直是开源发展的重要驱动力。当出现垄断时,我们希望大家团结起来,开源社区为大家提供了一个抱团取暖的平台,大家在共同社区维护共同版本,就有可能形成一定的优势。以生成式AI开源的情况来看,ChatGPT的问世带来了大语言模型的百花齐放,其中GPT4的优势目前最为明显。那么现在,众多跟随者大概又到了抱团取暖的时刻,只是尚未明确抱团取暖的基本态势。从目前大模型开源、闭源的情况以及各个大模型发展的时间线来看,这些模型目前还处于“战国时代”,也就是说,大家都在各自为营。如何形成一个大家共同维护的开源大模型的合力,技术上仍有许多值得探讨的事情,这正是开源闭源交织的问题。
二、软件供应链全球化在基础软件领域开源不可逆
虽然当前社会经济领域有逆全球化的趋势,但软件供应全球化至少在基础软件领域开源是不可逆的。在经济全球化受阻的大背景下,科技领域尤其是开放科学还在持续进行。开放科学涉及开放硬件、开放软件、开放访问、开放数据、开放教育资源等,即所谓的“HSADES”,其中科学数据开放已成为全球共识。近年来,世界各国在科技领域的竞争日趋激烈,虽然一些少数团体要求审视科学数据完全开放政策,但从全球态势看,还没有出现科学数据共享通道关闭的征兆,所以开放科学仍然是进行时。
在过去近20年间,云计算、大数据、AI的发展均受益于开源。以AI为例,其快速发展离不开代码的开源和数据的开放,包括开放开源的框架、开源的算法和开源的数据,这些开放推动了大数据和AI的快速发展。开源软件,具体到软件的生态领域已然全球化,而且已经形成覆盖全球的错综复杂的开源软件生态链。从硬件资源的供应链到系统技术的供应链,一直到上层应用的供应网络,形成了一个非常复杂的网络。
开源已经离散在生活中的每一个角落。2021年,有两个报告均提到行业领导者90%都在使用企业开源软件。而Synonsys(全球排名第一的电子设计自动化EDA解决方案提供商)提到17个行业里的1500个代码中,有98%都是开源代码。由此可见,开源是不可逆的,即便开源行动没有涵盖所有领域,但就基础软件领域和程序员的全球生态化而言,开源的确不可逆。例如Linux,其已经成为日常生活中绝大多数人都会使用的系统,R语言更是有上千个软件包并建立了上万个复杂的依赖关系,这就是信息技术生态的复杂性。
再举两例。一是开源的云计算管理平台OpenStack14,现已有817个代码仓、2439个开放者和250个机构模式、8种贡献模式、4种任务选择模式、3种协作模式,然后是提供部分解决方案、业务集成等一系列支持,形成了一个巨复杂的OpenStack生态。二是深度学习框架,以TensorFlow和PyTorch为代表的开源深度学习框架支撑了大量的深度学习应用。
与此同时,全球化开源生态也会带来很多不确定性,特别是在安全领域。开放供应链的复杂性,使得开源供应链面临的风险受到持续关注,如Apache Log4j漏洞事件曾引起巨大轰动(编者注:自2021年12月7日公开,Apache Log4j 漏洞被认为是“2021年最重要的安全威胁之一”,称其为“核弹级”漏洞并不夸张。该漏洞已被广泛应用于勒索、挖矿、僵尸网络上,黑产组织则利用Log4j漏洞发起多个攻击事件),当然还有更多的类似事件。人们在大量使用开源软件的同时也会担忧其安全性,于是从政府到社区、从产业界到学术界都在建立各个级别的安全保障体系。2021年,美国发布了关于改善国家网络安全的总统行政令,明确要求政府加强对供应链的安全管控。2022年,阿里巴巴的王坚提出供应链安全试验,尤其是开放带来的复杂软件供应链问题,已经引起政府、社区、企业和学术界的普遍关注。
有鉴于此,国家层面需要考虑构建面向全球的开源生态体系,这将涉及政府、市场、社区、企业和个体。尽管开源社区有常用的治理体系,但全球化的开源生态需要全球化的体系,这涉及全球层面,包括很多国家的法律法规、标准规范和技术工具等相关方面。
三、大模型和生成式AI的发展或将大幅提升开源开发的质量与效率
过去几年,国内的相关研究团队围绕群体智能做过一些开源软件开发工作,提出了人工群体智能概念和构建群体智能的构造性模型。群体智能是科学家长期关注并研究的一种自然现象,也就是说群体中间每个个体可能不具备智能或者智能非常有限,但由个体构成的群体会展现出远远超出个体能力的智能行为,这是低等生物群体里的矛盾现象之一。西方起初把社会性生物群体层面展现的群体智能称为Smart,后来为了从社会层面进行区分改称为Collective,两个单词本质是一个意思,只是针对的群体不同。以低等生物群体智能为例,菌群聚合、蜂群筑巢、鱼群避敌、蚁群寻食等,都不是靠个体单独完成的任务。但微小的个体最后产生的效果却非常好,甚至堪称精美,这是低等生物群体智能现象。放大到人类社会,平庸的人在一起协作也能产生群体智能现象,歇后语“三个臭皮匠顶个诸葛亮”揭示的就是这个意思。市场经济通过一只“看不见的手”,却能够进行大规模资源的有效配置,这也可以被视为群体智能的典型现象之一。
怎样理解生物群体智能?早期有一位法国科学家提出了环境激发效应,并用这个概念解释生物群体智能形成的机理。环境激发一词来源于两个希腊词根,一个是刺激,一个是工作,受刺激而工作。基于环境激发效应,个体在工作中就会留下痕迹,这个痕迹被其他个体感受到,从而刺激这些个体留下新的工作痕迹,慢慢汇聚起来的工作痕迹形成了群体智能。互联网产生以后出现的网络空间,汇聚了人类智能群体,为人类跨时空大规模协同提供了可能。随着互联网技术的不断发展,大量网络应用出现,这使得互联网上一批松散的人群可以通过直接或间接的交互完成一系列需要大家共同完成的工作,维基百科就是一个典型的例子。现实中的众包模式,也是通过大规模用户分工合作完成的。此外,还有利用群体力量通过玩游戏的方式设计RNA(核糖核酸)分子结构,利用群体力量求解单向选择题,等等。
我们能否把群体智能用于开发软件这种更为复杂的知识逻辑制品呢?显然,开源软件开发就是人类聚集群智非常典范的例证之一。但这一群体智能本身仍属于比较原始的形态,通过大规模开发者群体的持续协同,能够维护开发一个复杂的软件系统,这涉及多种成功技术因素,比如开发技术有效的信息管理、自上而下的任务分解和自下而上的人员组成等。之所以其为原始形态,是因为它还没有达到群体智能所探讨和追求的完全分布式的社会化软件开发目标。当下,大多数成功的开源软件项目都依赖于一个小规模的精英群体完成顶层架构设计,并对版本发布进行严格规划和设置,他们更多集中于对源代码的管理和汇聚,对需求设计的支持不够。
环境激发效应这一概念,为理解群体智能现象提供了一种解释性模型,目前的研究主要关注群体智能的构造性模型。群体智能系统包括三个关键因素:一是信息激发,即如何有效激发每个个体提供与问题相关的信息片段;二是信息融合,即如何对不同个体提供的信息进行有效的融合;三是信息反馈,即把融合后的信息有效反馈至每个个体。激发、融合、反馈,这一过程不断循环,迭代起来,就是IFE(交互式前端技术)构造模型。
这个模型对群体智能系统的形成主要在两个框架内发生:一是物理空间,也就是现实世界,二是网络空间,包括数字化的物理空间。进一步观察信息的反馈融合是否为自然发生,或者是否有人造的自动化系统参与,用这两个标准来划分自然的群体智能现象、半人工的群体智能现象或人工的群体智能现象。我们用AI设计,是希望解决用人类设计智慧信息的融合反馈算法。在物理空间,有纯自然的群体智能,比如蜂群筑巢等。在网络空间,智能也少有人工介入,只是利用网络上原始信息的储存和具有传播能力的材料,比如开源主要是通过邮件列表做,还有众包。人工群体智能就是加入人的干预,这在物理世界还没有找到具体案例,但我们认为在网络空间也许能找到,也许还可以构造。网络空间具有高效的信息融合能力以及个性化信息高效的反馈能力,这是一种业内追求的群体智能的理想形态。
人工群体智能借助人工设计的智能模型预算法,实现了对群体中海量信息的有效融合与个性化反馈,在群体内部形成信息的正反馈回路,进而在群体层面涌现形成超越个体智能的智能现象,这就是所谓的群体智能。
那么大模型和生成式AI能带来什么?它或将为海量信息的高效融合与个性化反馈提供创新性解决方案,可能会大幅度地提升开源软件的质量和效率,进而提升开源开发的群体智能水平。大模型作为海量信息的融合器,靠大模型融合而不是靠人。AIGC则针对软件开发领域,结合个性化能力形成个性化信息反馈,再回到模型就变成一个大模型矢能的ACI。人工群体智能把大模型作为信息融合器,将使得上述这个循环运转得更快,汇聚得更快。
四、如何更好地推进开源发展
第一,对开源生态的构建,要大力弘扬开源精神,把握开放、共享、协同、生态的开源本质,鼓励奉献,尊重市场,积极探索开源的商业模式。第二,积极推进构建面向全球的开源生态治理体系,从人类命运共同体的视角来促进全球化开源生态。第三,积极探索LLM/AIGC在开源软件开发中的应用,构建面向开源软件协同开发的ACI系统,在维护开发者群体多样性和持续创造性的前提下,有效提升开发效率和质量。
现在业内在谈开源软件面临的各种各样的问题,很多专家说未来人类文明就运行在软件之上,而在整个软件体系中,毫无疑问开源软件是非常重要的组成部分,特别是在越来越基础的层面,开源软件构成了人类社会的基础设施,因此我们有必要站在人类命运共同体的视角维护人类社会的基础设施,而不是走向逆全球化之路。实际上,开源社区治理体系已经相当成熟,在这种情况下,我们仍在探索有没有新的模式,特别是适合于中国开源发展的模式。
(作者系中国科学院院士,中国计算机学会第十二届理事会理事长)