数字经济基础设施建设的探索与实践

0

梅 宏

数字经济是一种新的经济形态,我国高度重视数字经济发展,实施国家大数据战略,建设数字中国。2022年年底,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》;2023年2月发布的《数字中国建设整体布局规划》,指出建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。加快数字中国建设,对全面建设社会主义现代化国家、全面推进中华民族伟大复兴具有重要意义和深远影响。

一、支撑数字经济发展的基础设施

基础设施是为社会生产和居民生活提供公共服务的物质工程设施,是用于保障国家或者地区社会经济活动正常进行的公共服务系统,是社会赖以生存发展的一般物质条件,包含交通、邮电、供水供电等,很多社会公共服务都属于这个范畴。数字经济时代的基础设施包括原有的基础设施和信息基础设施,后者包含了硬件、物理载体、网络连接、公共软件服务、传统物理基础设施的数字化等。

2008年,中国推出四万亿大基建计划,主要围绕高铁和路桥等基础设施建设。2020年5月,“新型基础设施建设”正式写入政府工作报告,明确重点支持既促消费惠民生又调结构增后劲的“两新一重”建设,主要是:加强新型基础设施建设,发展新一代信息网络,拓展5G应用,建设充电桩,推广新能源汽车,激发新消费需求、助力产业升级。随后,我国完成全国一体化大数据中心体系总体布局设计,全面启动“东数西算”工程,打造全国一体化算力网络,实现数据互通互联。这一切除了信息基础设施之外,最终还要通过软件的方式来实现传统物理基础设施的数字化和软件定义。正如C++语言的发明人本贾尼·斯特劳斯特卢普所言,“未来的人类文明运行在软件之上”。

互联网是数字经济基础设施建设的关键核心,互联网极大拓展了人类沟通和协作的时空,是社会经济活动不可或缺的平台。数字经济的概念最早出现在互联网进入大规模商用的上世纪90年代中期,早期的数字经济是指电子商务、电子交易,即互联网发展带来的新经济模式,现在这个概念从数字产业化拓展到了产业数字化。

数据是数字经济的基本要素,数据的汇聚、碰撞与融合是其价值释放的前提。通过共享、流通和交易,激活数据要素市场,这是发展数字经济的基础。互联网是数据流通汇聚的平台,但仅从现有的互联网及其提供的软件设施来看,其技术和能力效率要达到发展数字经济的要求,还有一段差距。例如,在数据要素化方面,我们需要数据有独立存在的形式,现在的数据基本和应用紧密关联,已经不再依赖于具体的系统和业务场景,而是需要独立存在于某一个库中,通过不同的业务场景提供服务。近年来,我国数据平台发展取得有目共睹的成效,但也带来了若干弊端,比如数据垄断等问题,都引起社会的高度关注。

从某种意义上讲,Web1.0是“阅读式互联网”,Web2.0是“可写可读互联网”,而我们希望Web3.0拥有自己的数据,这一技术趋势在一定程度上也反映了人们对平台的反思和对自身数据权利的追求。个人和企业在社会经济活动中产生的大量数据,是散落在互联网上的,其特征表现为信息不完整、数据难协同、应用难扩展以及数据收益分配不合理等。

个人或者机构作为原始数据的来源,是否可以获得合理的收益?现在很多西方国家都在讨论数据税的问题,目前数据税是通过政府途径征收的,但如果从另外的角度出发,一旦Web3.0实现,个人拥有自己的数据空间,是不是也可以获得一些数据使用费?比如,平台使用个人的数据,需要象征性支付一些费用。所以,在这样的背景之下,我们需要构建一个数据的基础设施。

二、数字经济基础设施构建的技术路径

我们设想了一个支撑数字经济的基础设施的技术层,它的底层是互联网,包含移动互联和物联,在技术层的上面构建一个以数据为单元连接的数联网,数联网基础之上构建数据空间,在空间上面再构建一系列应用。数联网将数据作为可独立管理的资源,是机器网上形成的数据网络,它支撑数据的互联互通互操作。而数据空间是在数联网之上构建的,它是按照所对应的物理实体结构、关系,对数据进行管理、组织的一个物理世界的孪生数据空间。

近年来,已经出现了许多这方面的技术路线。例如,图灵奖的获得者、万维网的发明人伯纳斯·李提出了链接数据(Linked Data)的概念,希望通过使用统一的标识符、标准格式和协议,来连接分散在全球各地的数据资源,从而使数据能够互相关联和交互使用。第二个技术路线是数字对象体系架构(DOA),这也是TCP/IP的发明人、图灵奖得主罗伯特·卡恩提出的一个体系。他通过数字对象模型定义数据的三个要素,标识原数据和实体,再通过三个核心系统和两个基础协议,定义数据对象之间的互联互通和互操作。通过在日内瓦成立DONA基金会,卡恩实现了数字对象体系架构的推广。

这两条技术路线都是把数据当作独立资源,赋予其唯一标识,对原数据进行描述,并通过特定的交互协议来访问数据。它们的差别在于,链接数据沿用了万维网的标识解析域名解析协议(DNS),但数据本身是依赖机器寻址,机器虽然有地址,然而数字对象架构和机器地址分离,其每个数据对象都有全球唯一的地址,不受机器地址的约束,格式也相对不一样。另一个技术上的差别体现在数据关系方面,链接数据的关系是显示存在的,而数字对象体系架构的关系是通过在实体里面的描述,引用关系来表示的。

从数据空间的视角看,自计算机诞生之日起,数据管理就具有必要性。数据库技术打破了数据应用一体化的信息系统的构建方式,实现了数据和应用的第一次分离。但是我们基于数据库的信息系统,仍然坚持业务导向,采用面向应用、效率优先的数据组织方式。在人机融合的泛在计算时代,万物数字化和万物互联的需求,就是构建物理世界的数字映像和物理实体的数字孪生需求,这是现行数据管理技术难以做到的,因为每个人的数据分散在不同的数据库里。未来我们应该探讨一种新的方式,围绕物理实体来组织数据资源,然后再围绕数据空间构建不同的应用。

当前,数据空间的构建大概有三种做法:一是基于互联网,按照一定规则和机制搭建平台构建数据空间,它主要关注平台之间的高效率、高一致性和高容错性。二是基于伯纳斯·李的技术路线,即链接数据。通过社交网建立个人数据空间,SoLiD的核心思想是解决应用和数据解耦的问题,要解决个人数据的所有权问题。通过SoLiD POD存储从应用中分离的用户数据并给予WebID来对数据进行访问控制。三是基于数字对象体系架构的数字对象标识符系统(DOI)。在出版行业,DOI系统把书籍、论文、报告、视频等所有数字资源构建为数字对象,支持通过唯一且持久的DOA标识访问数字出版物。目前这是全球比较大的数据空间,其中的所有出版物都各有一个DOI,这是全球唯一标识。

三、当前的探索与实践

在数字经济基础设施实践方面,北大团队在2000年开始关注互联网的变化,并提出网构软件的概念,积极推动软件研究。之后,我们从软件的互操作进入了数据的互操作。2018年,北大团队和罗伯特·卡恩团队开展合作,推广数字对象体系架构DOA,我们把数字对象DO的网络,称之为数联网。之所以选择这个技术路线,是因为我们认为将数据的寻址空间和机器分离,可能会更好。在机器地址上,还有一个全球唯一的数据地址,它不再依赖机器,而是完全依赖数据。我们的合作主要在三个方面展开:一是基于数字对象架构,把数字对象的三要素加入显示的关系;二是把数据对象标识联网扩展成标识原数据关系;三是要素分步的自组织联网,去除数字对象接口协议对HTTP和TCP/IP的协议绑定。

在构建相应的软件系统方面,我们采用软件定义的方法,实现并扩展了DOA的基础协议、核心构件和共性服务,在互联网信息网络上,提供多个系统和构件之间的接入、标识、发现、交付、使用、管控等基本功能,来支持其应用。从数联网的组网系统、栈点系统、服务系统到应用系统,都有一系列基础软件栈。此外,我们还设有一个全国的重点实验室,支撑该项技术的研发。在整个技术框架内,底层是网络,在网络上是基础协议,我们团队参与了协议的扩展和协议的实现。协议基础软件的实现,从基础协议的参考实现,到基础设施的参考实现,都是按照开源的方式来做,往上就是数据空间的构建,这一系列的应用软件构成一个基础的技术栈。

目前,我们也拥有了一些应用示范,比如,中国工业互联网研究院进行工业数据要素的确权登记,构建了全国统一的技术平台。在科研领域,国家科学数据中心协同计算的核心是科学数据的共享,我们构建了一套跨学科的数字对象的标准格式,把科学数据标识化形成数字对象。在医药研发领域,我们构建了一个医院的医学临床数据的数字对象,通过数联网的方式把数据标识连接起来,构建了一套面向医药行业的数联网应用。新型研发机构要推进成果转化,同样也是通过数联网的方式,我们把新型研发机构中的资源共享、产业发展、科技金融服务以及知识和数据服务,通过数联网对外进行共享和流通。在数据跨境方面,北京大兴机场临空经济区,在做国际数据合作合规编码与登记的证书,促进数据的跨境流动。

如何在数联网的实践体系上构建数据空间,开发出和物理实体紧密相关的应用?我们的基本设想是针对物理实体构建其数据空间,在上面搭建不同的应用。无论是个人还是企业,都会运用到很多平台,比如刷抖音、订票、做信贷和银行打交道等。现在这些数据都分散在各个平台,如果获得授权把这些平台上的数据拿下来,形成自己的数据空间,那就可以通过这个空间去支撑数据在不同平台上的应用。换言之,从数据相关方授权的各个应用中拿到数据,同时再回到各个应用系统中,这样就可以实现数据的价值,也就是数据费。数据从各个应用系统中被创造出来后,也能回到数据相关者的手上,这就是我们想构建的理念。

通过这个数据空间,把数据分享到相关部门,实现实时批复,节省大量的人力成本和时间成本,大大提升了效率。我们在互联网平台上推动数据要素化,就是希望构建一个数联网,搭建对应物理世界的数据空间,进而根据数据空间来支撑不同需求的数据应用。

(作者系计算机软件专家、中国科学院院士。本文根据作者在2023第八届世界物联网大会开幕式上所做的主题演讲整理。) 

评论被关闭。