乐趣区

关于人工智能:遇到联邦计算数据碰撞难题怎么办不妨试一试PSI

摘要: 随着 MPC、隐衷计算等概念的风行,诸多政府机构、金融企业开始思考参加到多方计算的场景中,扩大数据的利用价值。

本文分享自华为云社区《应用 PSI 解决联邦计算的数据碰撞问题》,作者:breakDraw。

联邦计算场景

随着 MPC、隐衷计算等概念的风行,诸多政府机构、金融企业开始思考参加到多方计算的场景中,扩大数据的利用价值。

以上面这个场景为例,银行可能心愿获取水电局和本人银行内储户的数据,来综合计算失去各公司的信贷评分等级。

那么银行可能心愿执行如下 sql,来失去信贷评分。

select0.5*c. 赞助金额 *0.3+0.4*a. 贴息金额 *0.3+0.2*a. 标的金额 *0.3+(0.05*b. 水费缴纳金额 +0.05*b. 汽费缴纳金额 +0.05*b. 电费缴纳金额)*0.1
frompartyA.taxa.partyB.amountb
ona.id=b.id

问题

上述联邦计算场景中,须要做 join 操作,来进行水电局和银行数据的关联。传统计划中,会在 TEE 中进行碰撞操作,失去关联数据,再进行计算。

但水电局的用户数量是十分多的,而银行的储户数量相对来说是无限的。因而理论关联数量是以银行储户数量为准。

如果将水电局的数据如果全副上传到 TEE 中,则软硬件之间的传输代价会十分大,且这个过程将非关联记录的敏感数据也会一并带上来。

另外银行的储户身份也可能是高敏感隐衷。

解决

应用 PSI 计划(隐衷爱护汇合交加)能够无效地解决上述两个问题。

PSI 通常具备以下三个特点:

  • 半可信场景:数据单方不违心裸露所有数据,仅心愿求得数据汇合交加
  • 数据最小化:除了数据汇合交加以外的数据不能泄露给任意一方
  • 平安单方计算:参加计算的单方须要独特实现一套平安的计算协定,以保证数据的安全性。
    具体流图如下:

该过程可保障 A 方和 B 方的 id 在纯密文的场景下进行碰撞,失去关联 id 汇合,并以此为根据输入。

利用

以后 tics 的联邦计算业务已反对 psi 的利用。

联盟治理页面,管理员开启“高级别隐衷爱护”。当开启之后,如果满足 PSI-JOIN 的 sql 语句,tics 便会选用 psi 的形式构建执行打算,进行 join 碰撞,再持续后续的计算。

创立作业,执行对应蕴含 sql-join 作业

执行作业,能够看到 tics 零碎的 DAG 图中,展现了 psi 的全副过程。输入后果与间接做 join 的后果是统一的。

点击关注,第一工夫理解华为云陈腐技术~

退出移动版