基于开源大趋势的芯片设计正在走向开放

0

包云岗

摘 要:开源项目中体现的数字优先思维方式和远程优先协作模式是解决创新研发生态商业协同难题的有效生产方式,已经成为EDA等关键软硬件技术升级和产业发展的主要模式。在芯片设计领域,开源RISC-V发展迅速,生态、产品化均有长足进展。AI大模型的运算,需要在处理单元与存储单元之间做大量的数据迁移,给芯片的功耗、成本带来极大负担,对算力提出更高需求。RISC-V作为一种开源指令集,其开放性可以在芯片开发中给予设计人员更大的自由度与创新空间。作为最受关注的开源硬件项目之一,中国的香山(一款开源RISC-V处理器核)在GitHub获得了超过3580个芯标,在全球有着巨大的影响力。香山项目如何发展,如何进一步发挥RISC-V开源优势推进创新,中国在全球RISC-V生态中发挥着怎样的作用,未来发展趋势如何演变等,已成为市场关注的重点方向。

关键词:开源;芯片开放设计;RISC-V;香山;德州仪器模式;变革与机遇

开源是推进基础软硬件建设的重要条件和基础,开源通过汇聚创新资源、构建信任环境、促进智慧知识技术成果等的共享,加速创新要素高效流动,创造更大的价值。在EDA领域,开源范围包括芯片设计验证及测试、逻辑综合、物理设计建模、物理验证、器件模型参数提取、工艺模型以及PDK验证设计板设计及验证等,这些领域的开源都为EDA的发展提供了源源不断的活力。在芯片设计领域,开源RISC-V发展迅速,生态、产品化均有长足进展,如何进一步发挥开源优势,推进创新,成为市场关注方向。RISC-V作为一种开放指令集架构在全球范围内的影响力和吸引力日益凸显,得到了全球学术界、产业界的积极参与,而中国也在全球RISC-V生态中发挥着重要作用。当前,人们对AI算力的需求迅猛增长。在 AI算力需求增长过程中,离不开通用计算的支持,面对一种复杂的应用,处理器不可能只有AI加速器,而是需要多种处理器的协同整合。AI大模型的运算,需要在处理单元与存储单元之间做大量的数据迁移,这给芯片的功耗、成本带来极大负担的同时,对芯片设计也提出了更高要求。

一、芯片设计正在走向开放

当前,全世界对芯片的发展逐渐形成一个共识,即芯片也开始朝着开源芯片的方向趋近。今年麻省理工学院的《技术评论》(Technology Review)评出十大科技突破性进展,把RISC-V列为其中一项,该评论特别指出芯片设计正在走向开放,同时灵活、开源的RISC-V有望改变一切芯片设计。20世纪80年代,芯片设计架构迎来一波技术变革的浪潮,芯片设计从复杂指令级转变到精简指令级,指令级架构从私有转变至开放共享。幸运的是,包含各个机构在内的中国企业都在这波浪潮中发挥了积极作用。为什么这种开源开放能带来价值,能带来影响力和生命力?

今年图灵奖的获得者,是发明以太网的梅特卡夫(Robert Metcalfe)。不过,在20世纪七八十年代,他并不是以太网的唯一研发者,当时很多企业都在研制类似技术,甚至IBM、苹果都在做局域网这种互联技术。那么,为什么50年后以太网脱颖而出成为现有局域网采用的最通用的通信协议标准,并发展成为可以创造300亿美元以上的规模产业?图灵奖公告提及了两个关键词最为核心,一个是商业化,另一个是标准。商业化当然是梅特卡夫通过成立3Com公司和研发核心技术来推进的,不过标准尤其是开放标准在其中则起着非常重要的作用。1980年,梅特卡夫联合Intel、DEC、Xerox创立了以太网标准,并成立了工作组,IEEE 802.3工作组的创建,推动了以太网标准的制定,从而让全世界任何公司都可以在以太网创建自己的产品页,这就是开放开源带来的价值。芯片设计里的指令级架构和以太网的发展路径非常类似,这就是为什么开源芯片能够得到全世界关注的原因。

指令级架构以前全归公司所有,但RISC-V却以开放的方式出现,指令级本身是标准而非实现,真正的实现要基于这个标准去构建。从开源芯片整个生态角度来看,指令级只是第一步,有了指令级还要做架构设计才能形成微架构一系列文档。很多文档需要几百甚至上千页的设计文档,通过工程开发形成代码,再借助EDA工具(电子设计自动化)把它变成版图,这使芯片在整个设计过程中涉及多个层次的开源开放,指令级只是第一个层次。指令级开源是芯片设计的基础与前提,指令级开源开放后,接下来的设计、文档、代码是否开源仍待讨论。第二个层次是开源的设计和实现,中科院“香山开源硬件项目”在这方面做了一些贡献。第三个层次是关于工具、流程是否开放的问题,如果走不到第三个层次,开源芯片生态就无法构建起来。

二、为产业领域带来更多新的变革机会

芯片开源新趋势也带来很多新机遇。

第一是为产业领域带来更多新的变革机会。从基金会的活跃程度可以看到,RISC-V国际基金会2020年把总部从美国搬到瑞士后,仅用3年的时间就发展得非常迅速,目前已经有70多个国家3000多名会员参与,年均增速超过100%。全球统计数据显示,美国、中国和欧洲是踊跃参与的国家和地区,体现出这三大区域的活力、经济状况和市场需求。值得一提的是,欧洲地区参与度较高的是大学,而美国和中国参与度较高的则是企业。相较于大学,企业带来的活力会更大一些,所以欧洲在开源芯片这波浪潮中相对落后于中美两国。不过,欧洲在寻求产业领域变革方面的意愿还是非常强烈的,去年9月8日欧洲发布产业领域变革路线图,提出九大发展方向。从RISC-V的代码仓库能看到方法论EDA、一系列与开源硬件相关的工具以及实施的路径,如通过非营利机构支持RISC-V的研发及实施教育措施等,管中窥豹,可见欧洲也在努力入局并试图迎头赶上。然而深入观察后,发现他们的意愿虽然很好,但从实践落实方面来说与中美还存在差距。

就目前掌握的国际前沿最新动态,我们应该摒弃RISC-V是面向中低端的旧观念。三年前的RISC-V主要面向嵌入式MCU,而今天的RISC-V已经开始往高端路线发展。当前,业内已经出现一系列高性能的RISC-V处理器。比如,由硅谷两家企业推出的芯片,其性能对标ARM最先进的一档处理器;中国香山也正在对标ARM高性能处理器,北京算能今年发布的全球首款64核RISC-V服务器级别处理器,无论在国内还是国际上都处于行业领先地位。

开源芯片生态的构建离不开软件的发展,整个软件的生态比想象的加速还要再加速。一方面是开源基金会工作组的大力推进,另一方面则是开源社区在主动适配,即其他社区开源软件主动指向RISC-V。据最新统计,全球有11000多个开发者和开源社区的开发者在围绕RISC-V架构做适配,这个规模和推力比想象得要大。安卓也在把RISC-V当作一个大力发展的平台,和ARM放在同一个级别上。中国科学院也在RISC-V相关软件上投入了大量工作,而国内在构建整个RISC-V软件生态方面,也做出了非常突出的贡献。从安卓、JAVA到OpenEuler,国内开源社区的力量在每个层面上都有积极的投入,中国在这一轮开源的RISC-V软件生态中做出了积极贡献。

而从全国范围看,RISC-V的发展动态也很活跃。2018年以后,RISC-V在国内被应用的新闻越来越多,无论是初创公司还是上市企业都在各个领域内使用,每年都有十几款基于RISC-V的芯片推出。仅国内的RISC-V初创公司融资就高达80多亿元,可见这是一个比较活跃的科技投资领域,反映出强烈的社会资本投资倾向。

第二是为人才培养带来新机遇。芯片的开源开放有益于促进人才培养。在设计领域,复杂芯片的设计长期面临着重理论轻实践的困境。实践之所以少,是因为两大壁垒。一是教学资源不平衡,大量的教学资源集中在少数大学里,即使很多学生有意愿参与芯片设计工作,却无法获取相关教学资源,可见教育资源在这方面是失衡的。二是学科划分不科学,中国的学科越分越细,学科之间条块化明显,虽然现在电子集成电路是个热门专业,但集成电路里的很多专业体系结构课并不开设,这如何能培养出研发CPU复杂芯片的人才?教师在操作系统或者计算机课程里最深讲到微架构理论,就不再往下拓展延伸,电路等物理设计也都不学,所以国内的芯片设计人才在知识结构上存在天然的缺失。现在,通过开源开放的方式可以把一系列的知识壁垒都打通,学生通过开源EDA掌握EDA知识,通过开源芯片掌握芯片知识,再通过开源软件把这些知识点串联起来,更好地参与到实践中去。经过培养再进入开源社区进而破解芯片设计人才“卡脖子”的难题,这就是中国开展“一生一芯”计划的目标(编者注:“一生一芯”计划的愿景目标是,在中国科学院大学实践经验的基础上向全国辐射,帮助更多高校形成从处理器芯片设计到流片并运行操作系统的实践课程,提高我国处理器芯片设计人才培养规模,缩短人才从培养阶段到投入科研与产业一线的周期)。

2019年,中国科学院大学公布了首期“一生一芯”计划成果,由5位2016级本科生主导完成的一款64位RISC-V处理器SoC芯片设计完成并实现流片,芯片能成功运行Linux操作系统。这是RISC-V全球峰会接收的唯一由本科生完成的设计,整个设计的开源开放在GitHub上获得了大量的关注,现在有1000多个Star、200多个Fork。中国科学院软件所把OpenEuler移植到这款名为“果壳(NutShell)”的处理器芯片上,该芯片就能够在学生毕业设计中运行一个工业级的操作系统,这个成果让人备受鼓舞。

从第一期一所高校5位同学开始,学员的培养规模逐步扩大,第二期已经扩展至五所高校15位同学,到2022年的第五期计划,有300多所高校的1600多位同学报名参加,累计报名人数也达到4000多人。然而,真正能够持续学习下来的大概只有600名同学左右,因为大多数学生课内外获取的知识还不足以支撑如此高强度的实践课。但是很显然,开源开放对我国一些课程的学习或者教学是有一定促进作用的,而通过“一生一芯”计划也可以了解我国芯片人才培养的真实情况。

三、德州仪器的开源模式为IoT领域赋能

开源芯片是一个趋势,并且带来了新机遇。开源芯片未来将如何发展,对业界各方面将产生什么样的影响,成为业界普遍关注的话题。虽然RISC-V与ARM和IntelX86进行对比的确有优势,但如果直接跟ARM对比反而埋没掉其真正的价值优势。从企业的角度来看,开源芯片可能带来的不是ARM,反而可能是放大版的德州仪器。德州仪器的特点在于它的芯片非常碎片化,有8万多种芯片,规模也比ARM大好几倍。德州仪器在美国德州和马来西亚建有一些共享工厂,涵盖共享平台、共享库、共享工具、共享IP。公司内部在这个基础上搭建了上千个小作坊、小团队,这些团队基于共享平台、共享库开发各种各样的芯片。

德州仪器芯片需要搭配适当的场景出售,它配备有上百个场景,例如登陆德州仪器网站点击电子汽车场景,它就能给客户提供包括上百颗芯片的一个解决方案。先通过场景把芯片组合成解决方案,再通过提供解决方案向客户出售芯片,这就是德州仪器模式的高明之处,非常好地应对了芯片碎片化的问题。德州模式成功的核心在于它下面的共享,通过大量的平台共享使得上层能够更方便更快速地开发定制,这也是中国开发者始终坚持把底座开放出来、共享出来的原因。如果把芯片开发看成是一座冰山,那么架构上面的设计代码就是冰山水面上的部分,但要保持架构持续迭代演进就离不开冰山水面下的部分开发工具。本文所讨论的OPENDACS正是冰山下面的部分,是真正能够持续让上层架构迭代开发的关键核心,只有这部分开放共享了,那冰山水面上的部分才能有更多的人能够创造。

相比之下,英特尔在这方面就显得比较保守。英特尔的原代码是不可能给到客户的,它只卖芯片,更别提公开如何开发芯片了。ARM稍微开放一些,他们可以向客户提供IP甚至IP源代码,但也不会向客户透露芯片是如何开发的。事实上,通过更开放的方式,整个社区不仅能够访问到代码,也可以访问到开发代码的这些平台,这的确能给我们带来一些价值。开源开放能够产生什么样的价值,历史上有非常成功的案例。IBM在1981年推出PC的时候,除了把机器拿出来,还公开了所有文档,直到今天我们还能下载到它当年公开的文档。当所有的设计电路图和各种集成器的配置全部公开后,再做一台PC就变得很容易了。当年戴尔这样一个本科生,就是凭借IBM的开源带来的便捷,才创立了一个PC公司。那些由开源带来的价值可以降低整个行业的门槛,激发创新活力,让PC走入千家万户。如果没有IBM,那么惠普一台PC要卖到9000多美元;而IBM出现后,PC就降到1500美元,真正走进寻常百姓家。这就是开源开放带来的价值,它催生了一个新的产业。

现如今人机物三元融合是我们面临的一个比PC还要大的新兴产业,它对芯片的需求是千亿量级,这比PC产业要多出一个数量级。如何为这样的产业提供芯片解决方案,值得深思。不同行业的解决方案也都各有千秋,PC的解决方案由英特尔提供,AI芯片的解决方案主要由英伟达提供,它们的模式越来越开放,所需要的资源也越来越轻。英特尔自己建工厂,要达到500亿美元的营业额和上百亿美元的利润,才能支撑PC产业芯片的解决方案。英伟达更“轻”一点,它只做设计,制造交给台积电,所以当它实现150亿美元营业额和30亿美元利润的时候,大家都觉得它还有很大的成长空间,能够支撑AI产业的大发展。事实上,英伟达现在做到了更大的市值,而这种开源模式为它带来了更好的成长。ARM自己不做芯片,而且把IP提供给第三方,这种模式只需20亿美元的营业额和3亿美元的利润就能撬动智能手机产业,开源模式比英伟达更“轻”。通过一些非营利机构,无需利润和估值考核,只要找到众筹方式,就能够让企业具备定制能力,像德州仪器一样快速定制各种各样的芯片,这不仅是我们应对AIoT(人工智能物联网)产业的好思路,也是开源芯片能赋予的价值,而这其中当然离不开EDA的开源开放。

我们的愿景是把德州仪器的开源开放模式复制到IoT领域,通过国内28纳米工艺、40纳米工艺或是60纳米工艺,构建基于云的、开源的整个芯片生态,包含各种各样的开源IP、开源EDA等等,支持整个产业界成千上万家企业,使它们可以快速生产出定制的芯片。而在我们开源的软件生态中有几百万个App,这些App中有10%与一些物体产生交互,它就会产生大量的芯片需求。未来,如果开发App的团队同时也具备定制芯片的能力,那么这个开源生态或许就可以构建起来。

参考文献略。

(作者系中科院计算所副所长,北京开源芯片研究院首席科学家)

 

评论被关闭。