【直播回顾】冲量在线参加英特尔AI百佳数据智能专场:融合区块链与TEE技术的数据流通平台

【直播回顾】冲量在线参加英特尔AI百佳数据智能专场:融合区块链与TEE技术的数据流通平台,第1张

【直播回顾】冲量在线参加英特尔AI百佳数据智能专场:融合区块链与TEE技术的数据流通平台


10月15日,由智东西公开课联合英特尔创新加速·芯创大讲堂启动的线上直播栏目「AI百佳创新激励计划系列专场」的第4讲开播。在本期直播中,冲量在线联合创始人&CTO陈浩栋以《融合区块链与TEE技术的数据流通平台》为题,从数据流通的核心需求出发,深入讲解冲量在线融合区块链技术所推出的可信可追溯数据流通平台,以及其中基于Intel TEE技术的训练及优化技术,并且在最后分享了他们在跨行业和同行业数据流通中的应用案例。

可信数据流通需求

数据流通方案在设计方面需要考虑四方面因素,一是隐私,即MPC、联邦学习、TEE等技术保障数据可用不可见;二是安全,即系统安全机制、加密通信等相关技术保障数据安全;三是可信,即可信计算对计算的度量,区块链的不可篡改、可追溯、公平化权益等特性保障数据计算过程可信;四是智能,即大数据工程、机器学习、深度学习等技术提供了数据智能处理能力。

基于TEE与区块链的可信数据流通方案

可信计算核心目标之一是保证系统和应用的完整性,从而确定系统或软件运行在设计目标期望的可信状态。它包括两个实现手段,一是度量,即采集所检测的软件或系统的状态;二是验证,即将度量结果和参考值比对,看其是否一致。

可信执行环境TEE(Trusted Execution Environment)是计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。可信执行环境目标是确保一个任务按照预期执行,保证初始状态的机密性、完整性,以及运行时状态的机密性、完整性。目前,Intel SGX是热度最高且技术生态最完备的TEE方案。

为构建基于TEE与区块链的可信的数据流通场景,冲量在线提出了一个总体方案,它包括数据需求方和数据拥有方两部分角色。若把两部分角色撮合,需要将系统分成两个层面,即控制层面和执行层面,联盟链则提供数据协作管理服务。

基于TEE的机器学习优化

结合TEE、联邦学习和区块链这三种技术,冲量在线进行了可信数据流通的整体架构设计:将所有涉及计算的逻辑放入Intel SGX中,通过TEE来保证本地训练器、联邦学习参数服务器、区块链节点的密态计算,并且将TEE的度量值预先发布于区块链上,以该值作为各方相互验证的基准,达到利用区块链来协调各方进度的目的。

整体架构使用Intel Ice Lake/SGX2作为硬件资源,并且将冲量数据互联平台、Hyperledger Fabric、MySQL/FTP等软件部署于硬件节点之上。在此过程中,完成了三个优化。

  • 优化一:安全模型升级

整套数据流通系统将参数服务器迁移至TEE中,具有三个优势:一是能降低参数服务器的受攻击面,增加恶意攻击参数服务器的难度;二是能限制参数服务器的行为,检测是否有异常行为;三是能实现计算一致性,将TEE的度量值预先发布于区块链上,使得多方能通过远程认证的方式确认计算逻辑正常运行。

  • 优化二:兼容已有软件栈

冲量在线通过分层技术栈降低联邦学习系统迁移TEE环境的改造成本。借助第三方libos的基础上,封装SGX安全容器,在算法模块不改动程序代码的情况下,打包成SGX安全容器镜像。在此基础上,冲量在线构建了FL-Rutime分布式TEE计算运行框架,实现TEE节点间密态通信。目前已经完成兼容的有PyTorch、TensorFlow、Numpy第三方库,迁移了LR、CNN、XGBoost等联邦学习算法。

  • 优化三:可选的隐私保护等级

本方案中,冲量在线将基于SGX2的算子优化到了相较明文计算只多出30%的计算开销。SGX2优异的性能表现及跨节点的密态计算域为联邦学习的安全选型提供了新的选项。冲量在线结合TEE与差分隐私算法保护出域的过程数据,相较于传统的基于同态加密的方法,将训练性能提高一个数量级。结合TEE的联邦学习性能优化将是一个值得探索的工程研究方向。

行业解决方案

第一个行业解决方案与运营商相关。冲量在线在打造该项目之前,运营商也在构建各省分公司数据互联互通的平台,它主要是在区块链的技术基础上完成。然而区块链只能保证使用过程的登记,不能完全解决数据使用权和所有权的分离。这个场景的需求有三方面,一是充分整合集团内的运营商服务数据和政企服务数据,激活数据要素价值,二是各省分公司的数据资产安全和权益得到充分保障,数据流通过程可控、可查,三是在严格保护业务数据中的居民隐私信息前提下,对外提供数据统计分析能力。所以冲量在线的相关解决方案的设计思路是将TEE和区块链结合使用,即区块链依然承担使用记录的确权,TEE对数据的使用权和所有权进行分离。

第二个应用案例和政务相关,它涉及当下热点的碳配额交易平台。在这一场景下,相关各方有着不同的需求:企业一方需要接入成本低,交易灵活,核心数据不泄露;中立审计机构一方需要与政府和企业间建立互信;政府机构一方需要监管和审计便利,实现智能化科学治理。这一平台的构建主要基于区块链和TEE技术,在不暴露生产企业的碳足迹隐私数据的前提下,构建精准碳配额模型。

陈浩栋 :冲量在线联合创始人&CTO;曾任百度区块链BaaS、百度可信计算平台的首席研发架构师和技术负责人,从零到一构建了百度区块链、可信计算、云原生的商业化技术平台,主导实施了若干个大型金融级可信计算、区块链与云原生的私有化平台;在隐私计算、区块链、云原生、机器学习、分布式系统架构设计和优化等方面具备丰富的研发与实践经历,曾主导实践过多个数亿用户级别的大规模云端架构改造项目;作为核心贡献者,参与了IEEE、Linux基金会、中国信通院、金科联盟等多个标准组织的技术标准制定。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/4684490.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-07
下一篇 2022-11-07

发表评论

登录后才能评论

评论列表(0条)

保存