Password Checkup程序体积小巧,功能简单,但背后却对大量数据进行高安全等级处理。本地加密、密文数据对比等可以说是隐私计算基本概念的教科书式展现,也令其成为数据安全共享的典型科普案例。
iOS基于差分隐私技术"把隐私锁在本地"——在手中的隐私计算
移动互联网时代,手机里几乎承载了一个人收集所有的秘密。举例来说,如果一个被移除ID类信息的数据集发布,从法律和伦理来说这个数据集因为没有涉及个人隐私,因此是合法合规的。但是如果通过一些技术手段,利用不同数据集、公开信息之间的关联性,可以推测出某个具体个人信息的时候,问题就出现了。早在2013年一位当时就读于美国西北大学的研究生,结合搜索引擎与纽约城市出租车和豪华轿车委员会对外公布的一份2013年全市的出租车行程数据,便锁定了几位明星的行踪,证实了这一风险。
由此可得,仅仅移除数据中的ID这类信息是不足以保护隐私的。但要如何抵御上述情况中对于个体用户隐私数据的“精确计算”问题,而又能提高数据共享和使用的效率?
比如始终坚持选择成为用户数据守卫者的苹果公司,当其他公司都在通过各类方式采集用户数据的时候,苹果对此说了“NO”。但事实是,在一番努力后,iOS中仍有几个矛盾未解。比如苹果需要通过用户行为数据来对特定功能进行精准调整,以满足其智能服务。差分隐私技术便是破解这一问题的答案。跟随iOS 10的推出,苹果就已经开始使用差分隐私来收集并分析来自键盘、Spotlight和Notes的用户数据。
差分隐私的原理是用算法加扰个人用户数据,使上述的技术回溯过程无法实现。随后在无法获得原始数据的情况下对数据批量计算,输出计算结果。在获得机器学习所需的数据资源的同时,实现用户隐私数据的保护。
而iOS 10采取的是本地化差分隐私算法对用户数据进行计算。即对单个用户数据进行随机化处理,再将设备数据集体发送给苹果公司。苹果公司也不会收集用户键入的每一个单词或搜索关键字。这样一来能够有效消除苹果公司泄露数据的安全隐患,也减少了数据在传输过程中如因发生泄露而导致的不可逆转后果。
在2016年开始使用差分隐私技术的不止苹果公司,还有谷歌(RAPPOR系统)。而当时差分隐私领域的权威人士,著有《差分隐私的算法基础》一书的宾夕法尼亚大学教授Aaron Roth当收到苹果递交给他评审的差分隐私执行文件后,这位教授使用“开创性”一词评价了苹果在差分隐私方面的工作。
微众银行FATE平台 —— 人工智能时代联邦学习助力数据安全共享
人工智能的发展构筑于数据之上,却也受限于数据利用的瓶颈。一方面许多场景并没有足够数量的大数据,另一方面即使有大数据,这些数据也可能相互孤立,无法交流共享。尤其在相关法规(如GDPR)不断趋严,各行业数据安全意识不断提升的背景下,数据的安全流动与共享对机器学习乃至人工智能的发展带来了挑战。
于是,联邦学习应运而生,成为人工智能“量身定制”的隐私计算解决方案。联邦学习是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据的前提,按照底层数据加密(混淆)形态下共建模型。
联邦学习具有四大显著优势:一是数据隔离,二是保证模型质量无损,三是参与者地位对等,最后则是能够保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。
在国内,微众银行可以说是联邦学习领域的领头羊。早在2018年末,电气和电子工程师协会标准委员会(IEEE Standard Association)就批准了由微众银行发起的关于联邦学习架构和应用规范的标准P3652.1立项。微众银行成为工作组召集单位,工作组主席则是微众银行首席人工智能官,国际人工智能学会理事长杨强教授。
在2019年初举行的AAAI(Association for the Advancement of Artificial Intelligence)年会上,微众银行AI团队正式发布了联盟AI生态系统(Federated AI Ecosystem)和开源联盟AI解决方案FATE(Federated AI Technology Enabler)。
FATE提供了一个安全的计算框架来支持联邦学习需求。它实现了基于同态加密和多方计算(MPC)的安全计算协议,同时支持联合学习体系结构和各种机器学习算法(包括逻辑回归,基于树型算法,深度学习和迁移学习)的安全计算。
作为联邦学习领域第一个商用级开源项目,FATE为开发者提供所必须的多方协同建模工作流管理、加密机器学习工具库和并行计算基础设施抽象三层能力,同时提供了很多开箱即用的联邦学习算法和联邦迁移学习算法供开发者参考,极大简化了联盟AI开发的流程并降低了部署难度。
几乎同时,全国连锁租车品牌一嗨租车与微众银行共同宣布达成深度战略合作关系,宣布双方将在汽车出行、会员服务、金融保险、区块链技术等方面展开多场景多维度创新合作。一嗨租车使用联邦迁移学习、AI人脸认证技术、支付技术等金融科技,以优化提升用户体验为目的深度融入租车服务流程,并将租车场景与银行大数据风险控制体系相结合,从而为年轻一族及长租客户提供新的出行生活方式。
华控清交助力首都金融数据应用运行新模式——创新团队的创新案例
防范系统性金融风险首先要做到的就是能够及时发现和准确甄别金融体系中的系统性风险。有效的监管不光需要依赖金融监管部门本身的数据,还需要有效地利用各金融市场参与方的大量和实时的数据,使监管部门对金融行为和金融风险的画像更完整、分析更准确、判断更及时。但这些数据往往会涉及这些市场参与方的重要商业机密或客户隐私。
华控清交基于多方安全计算并融合其他隐私计算技术提出的安全数据融合解决方案,能够在不解密加密数据的情况下,直接以密文数据进行计算,从技术层面解决了数据隐私保护与数据高效流通对立的问题,使多个非互信金融数据源之间可以在数据全程加密的前提下进行高效的大数据融合和计算。
该方案获评“首都金融创新激励项目”,解决了“确保首都金融科技高速发展与提升监管水平、保障金融安全”之间的矛盾,开启了首都金融数据应用的新运行模式。
华控清交PrivPy平台架构