摘要:随着MPC、隐衷计算等概念的风行,诸多政府机构、金融企业开始思考参加到多方计算的场景中,扩大数据的利用价值。
本文分享自华为云社区《应用PSI解决联邦计算的数据碰撞问题》,作者:breakDraw。
联邦计算场景
随着MPC、隐衷计算等概念的风行,诸多政府机构、金融企业开始思考参加到多方计算的场景中,扩大数据的利用价值。
以上面这个场景为例,银行可能心愿获取水电局和本人银行内储户的数据,来综合计算失去各公司的信贷评分等级。
那么银行可能心愿执行如下sql,来失去信贷评分。
select0.5*c.赞助金额*0.3+0.4*a.贴息金额*0.3+0.2*a.标的金额*0.3+(0.05*b.水费缴纳金额+0.05*b.汽费缴纳金额+0.05*b.电费缴纳金额)*0.1
frompartyA.taxa.partyB.amountb
ona.id=b.id
问题
上述联邦计算场景中,须要做join操作,来进行水电局和银行数据的关联。传统计划中,会在TEE中进行碰撞操作,失去关联数据,再进行计算。
但水电局的用户数量是十分多的,而银行的储户数量相对来说是无限的。因而理论关联数量是以银行储户数量为准。
如果将水电局的数据如果全副上传到TEE中,则软硬件之间的传输代价会十分大,且这个过程将非关联记录的敏感数据也会一并带上来。
另外银行的储户身份也可能是高敏感隐衷。
解决
应用PSI计划(隐衷爱护汇合交加)能够无效地解决上述两个问题。
PSI通常具备以下三个特点:
- 半可信场景:数据单方不违心裸露所有数据,仅心愿求得数据汇合交加
- 数据最小化:除了数据汇合交加以外的数据不能泄露给任意一方
- 平安单方计算:参加计算的单方须要独特实现一套平安的计算协定,以保证数据的安全性。
具体流图如下:
该过程可保障A方和B方的id在纯密文的场景下进行碰撞,失去关联id汇合,并以此为根据输入。
利用
以后tics的联邦计算业务已反对psi的利用。
联盟治理页面,管理员开启“高级别隐衷爱护”。当开启之后,如果满足PSI-JOIN的sql语句,tics便会选用psi的形式构建执行打算,进行join碰撞,再持续后续的计算。
创立作业,执行对应蕴含sql-join作业
执行作业,能够看到tics零碎的DAG图中,展现了psi的全副过程。输入后果与间接做join的后果是统一的。
点击关注,第一工夫理解华为云陈腐技术~
发表回复