隐私计算在数字口岸的应用与前景展望

0

 吴志强

 隐私计算技术具备让数据“可用不可见”的特性,可以加速数据要素安全流通,助力数字口岸合作方挖掘多业务场景数据价值,共创数据互利生态。本文从隐私计算的架构设计、关键技术和核心功能出发,围绕数字口岸各部门、政府与企业以及企业与企业之间如何实现互联互通、信息共享和资源整合,在数据开放和高效利用的同时保护数据的安全性和隐私性,以及避免数据泄露方面进行阐述,探究隐私计算在数字口岸中的应用。

隐私计算技术可以实现数据“可用不可见”,加速数据要素安全流通,助力数字口岸合作方挖掘多业务场景数据价值,共创数据互利生态。基于MPC、TEE、区块链等技术的多方联合计算系统,为跨机构数据流通提供“可用不可见,相逢不相识”的数据安全,并有效解决海关、单一窗口、国际贸易市场主体等在数据交换、共享等场景应用中的数据安全问题和隐私保护需求。

一、隐私计算的架构设计

隐私计算架构设计为数字口岸系统提供成熟的隐私计算引擎,提供隐私计算核心功能,为上层业务应用提供基础计算能力。系统底层计算引擎包括安全联邦学习引擎、多方安全计算引擎、机密计算引擎。其中,安全联邦学习引擎是在传统联邦学习框架基础上集成的多种隐私计算技术,有效解决数据交换、数据计算过程中的安全问题,同时提升了计算性能。安全联邦学习引擎支持数据读写、数据预处理、特征工程、机器学习、评估、预测、模型导入/导出等上百个组件,支持横向、纵向、混合三种联邦方式,其核心架构如图1所示。

隐私计算系统可以对接数据提供方的数据源。当前,中国(福建)自由贸易试验区厦门片区能够基于现有的三大数据池,包括海关数据池、单一窗口数据池、数据分中心数据池,为多方计算提供数据资源,同时也支持如税收、保险、金融等其他单位的外部数据资源接入到隐私计算系统中。

隐私计算系统主要提供三个层次的服务。一是隐私计算系统提供安全加密、计算加速、区块链等技术以实现隐私计算技术服务。在此基础上提供安全多方计算系统、联邦学习以及可信执行环境隐私计算框架。 

二是为数据隐私计算应用场景提供数据中心、联邦中心、服务中心和安全监控等服务。数据中心主要支持数据管理、数据授权功能;联邦中心负责对数据成员进行管理和元数据管理;服务中心提供数据服务接口、数据合作方管理、项目管理、模型管理、任务管理等功能;安全监控主要完成系统的安全审计、权限管理以及资源监控等服务。

三是应用层的服务,主要依据隐私计算系统提供的服务支持几类应用,例如:数据联合查询、集合求交、联合计算、联合统计分析、联合建模等服务。

二、隐私计算的关键技术

在数字口岸中,隐私计算涉及众多技术方向。例如,同态加密、安全多方计算、分布式存储、安全联邦学习引擎、多方安全计算引擎、机密计算引擎等技术,详细介绍如下。

一是同态加密。同态加密是一种能够对加密数据进行计算并得到加密结果的技术,使得数据处理结果仍然是加密状态。在数字口岸中,同态加密可用于实现数据的机密性和完整性保护。

二是差分隐私。差分隐私是一种通过添加噪声来保护敏感数据的技术。在数字口岸中,差分隐私可用于对敏感数据进行脱敏处理,以保障数据的安全性和可用性。

三是安全多方计算。安全多方计算是一种能够实现多方共同计算的技术,同时保证各方数据安全性。在数字口岸中,安全多方计算可用于对多个部门的数据进行联合分析和计算,提高数据利用效率和安全性。

四是分布式存储技术。分布式存储技术是一种将数据存储在多个节点上的技术,以保障数据的安全性和可用性。在数字口岸中,分布式存储技术可用于实现数据的分布式存储和备份,避免数据集中存储带来的单点故障和安全风险。

五是安全联邦学习引擎。安全联邦学习引擎是一种基于联邦学习算法的技术,它允许在不共享本地数据的前提下,通过在多个拥有本地数据的数据源之间进行分布式模型训练,构建基于虚拟融合数据的全局模型。该技术可以保护数据隐私并实现数据共享计算的平衡,被称为“数据可用不可见”“数据不动模型动”的应用新范式。具体来看,安全联邦学习引擎通过在多个数据源之间进行分布式模型训练,在不需要交换本地个体数据或样本数据的前提下,仅通过交换模型参数或中间结果的方式,实现联合建模。这样可以避免数据泄露和滥用,同时保护各主体的隐私和商业机密。

六是多方安全计算引擎。多方安全计算是一种基于密码学的算法协议,可以在无可信第三方的情况下,协同计算一个约定函数,使得除计算结果外,各参与方无法通过在计算过程中交互数据推断出其他参与方的原始数据。具体来说,多方安全计算可以在多个参与方之间进行安全计算,实现数据隐私的保护。它可以在不泄露原始数据的情况下,对多个数据源的数据进行整合、分析和计算,以得到更加全面、准确的分析结果。在多方安全计算中,不同的密码学算法和协议被用于实现不同的功能,例如秘密共享、混淆电路、同态加密、不经意传输等。这些技术和协议的应用场景非常广泛,如多方联合数据分析、数据安全查询、隐私求交、数据可信交换等应用场景。

七是机密计算引擎。隐私计算中的机密计算是一种基于硬件可信执行环境(TEE)的技术,它可以在一个安全的计算环境中执行计算任务,保护敏感数据在计算过程中的机密性和完整性。机密计算的核心是将数据和代码的信任机制交给硬件提供商,这些硬件提供商可以在硬件级别上提供安全保障,使得即使操作系统或虚拟机监视器等高权限实体也无法窥探和篡改机密计算中的数据和代码。机密计算引擎可以在多种计算平台上实现应用,例如,在服务器、移动设备、嵌入式系统等平台上都可以实现安全、高效的计算操作。

三、隐私计算的核心功能

在数字口岸中,隐私计算的核心功能具体如下:

一是数据注册。数据提供方传输原始数据至数字口岸的隐私计算系统,系统对数据进行加密,自动生成相关元数据(即原始数据的描述信息)和权限证明,同时发布元数据,将加密数据发送至第三方。对于数据提供方来说,隐私计算系统支持多种数据源接入模式,主要包括三类:一是将本地数据文件上传;二是关联数据库;三是关联服务器文件路径。

二是数据计算。借助安全多方计算、联邦学习等技术实现数据计算。该功能可以提供丰富的算法库供用户选择使用,包括各类经典算法和用户自定义算法。支持多个项目的创建和管理,每个项目都拥有独立的数据空间和算法空间,可满足多项目并行处理的需求。同时,支持多种计算资源的灵活配置,包括CPU、GPU、FPGA等,以满足不同类型数据计算的需求。

三是模型管理。支持每个算法提供方计算模型到隐私计算系统,由系统对模型参数进行加密,自动生成相关元数据和权限证明,同时发布元数据供数据提供方查看,并提供如模型注册管理、模型授权管理等功能。

四、隐私计算在数字口岸应用的前景展望

随着技术不断发展和进步,隐私计算在数字口岸中的应用将会越来越广泛。

第一,进一步完善数据保护法规和标准。随着对数据保护的重视程度不断提高,未来将会有更多的数据保护法规和标准出台。这些法规和标准将为隐私计算在数字口岸中的应用指明更加清晰的方向。

第二,提供更加成熟和广泛的应用场景。随着隐私计算技术的不断发展和成熟,未来数字口岸中将会出现更多适宜的应用场景。例如,利用隐私计算技术实现更加精准的跨境贸易监测和数据分析,提高海关监管效能和通关效率,进一步推动数字口岸的建设和发展。

第三,提供更加高效的计算和存储技术。随着计算机技术的发展,未来将会有更加高效的计算和存储技术出现。这些技术将为隐私计算在数字口岸中的应用提供更加高效和可靠的技术支持和保障。

第四,加强跨国合作与交流。数字口岸是全球物流体系的关键环节之一,加强跨国合作与交流对于推动数字口岸的发展至关重要。未来,可以加强与其他国家和地区在数字口岸领域的交流与合作,共同探讨隐私计算等技术在数字口岸中的应用和发展趋势。

隐私计算在数字口岸中的应用前景十分广阔,未来将会有更多的技术、应用场景和合作机会出现,为数字口岸的建设和发展注入新的动力和活力。

(作者单位:中国(福建)自由贸易试验区厦门片区管理委员会信息化服务中心) 

评论被关闭。