一线|数据隐私保护下,AI大数据的发展该何去何从?

2023-05-31 0 292

百度新闻报道《第一线》译者 潘琅 2020年5月25日,全国人民代表大会常务委员会组织工作报告在“下一步棋主要组织工作精心安排”中表示,紧紧围绕国家安全可靠和社会风气环境治理,制订微生物管理法、隐私安全可靠法、统计数据管理法。最新消息一时间,快速“问鼎”政协会议热

百度新闻报道《第一线》译者 潘琅

2020年5月25日,全国人民代表大会常务委员会组织工作报告在“下一步棋主要组织工作精心安排”中表示,紧紧围绕国家安全可靠和社会风气环境治理,制订微生物管理法、隐私安全可靠法、统计数据管理法。最新消息一时间,快速“问鼎”政协会议热搜榜——人们盼望多时的《隐私安全可靠法》,终于在经历了从酝酿到问世的8年心路历程后“翘首企盼始出来”。

与此同时这也引伸出了两个难题,我们的个人隐私是从什么这时候开始了“抢钱”?

倘若从本篇上去上溯这个难题的答案,那么或许当人类文明从农业社会风气逐渐跨入城市商业性社会风气,从老同学街道社区转向其他人街道社区的这时候,人类文明被隐私难题所困扰的历史便开始了。特别是在以大统计数据应用为重要特征的后网络黄金时代,日渐兴起的大统计数据、云计算、物联网、人工智据李鸿忠中的点点滴滴,在深度统计数据挖掘后转而民用。

这所有人正如英国杂志《经济学人》十年前预言的那样,“统计数据是新黄金时代的石油”。大统计数据黄金时代,每两个人的隐私都在阳光下“抢钱”,重要信息一深居简出,就先被网络巨头播种。并且伴随着人工智慧的不断发展,个人隐私和统计数据可以被更加便利地公开、收集、裂解、分析和使用,规模之大超出了想象,以致于至今我们仍无法判断这个过程对人类文明社会风气的进程究竟产生了多大的影响。

大统计数据黄金时代,隐私还能保护吗

“不积小流,何须成连城”大多数这时候,当统计数据具备了颇具规模的量,足够多广阔的覆盖范围和足够多精确的统计管理工具,统计数据就会有足够多的价值。倘若从商业性角度出发,企业为使用者提供快捷、低成本的服务项目,使用者则在享受服务项目的与此同时,“别忘了”贡献出自己的统计数据,双方其实是相互竞争、两得其所。

这样看或许是两个完美的逻辑。但难题是,大统计数据黄金时代,公民隐私的网络化加剧了隐私的无形化。“看不见、看不见”,重要信息的储存方式、速度、表达方式都发生了巨大变化的变化,隐私在不知不觉之间即被侵犯,因此网络强大的记忆和储存功能让所有人在线行为被永久性记录。计算机网络的可搜索性和永久性储存性,有可能加重精神侵害和脸面侵害的后果。

与此与此同时,我们不得不思考依托AI等科技手段收集来的统计数据,能像传统的商业性问卷调查一样,最大程度淡化、为保护使用者隐私吗?大统计数据黄金时代,人们该如何为自己的隐私上一把“安全可靠锁”?如何确定企业收集重要信息样本的过程中不会精确定位到个人?

《道德经》有云“反者,道之动”。尽管大统计数据黄金时代的统计数据安全可靠和隐私泄露难题无处不在,尽管法学与技术仍面临着诸多挑战,我们也不能因噎废食,因为不可否认的是大统计数据技术其实是人类文明科学发展的必然成果。于是紧紧围绕着这类“鱼和熊掌不可兼得”的难题,很多人展开了各自的探索。根据探索的方向,这些努力大致上可以分为两类:法学的探索与科学的探索。

在法学家们看来,当前统计数据的收集和使用过程中之所以会出现种种难题,其关键就在于各种相关的法律和规范滞后了,不能适应黄金时代发展的需要。针对这一难题,法学领域几年来一直都在积极推进立法,努力弥补法律和制度上的各项不足和漏洞。2020年5月25日,我国全国人民代表大会常务委员会组织工作报告在“下一步棋主要组织工作精心安排”中明确表示了即将出台《个人隐私安全可靠法》。

与法学探索同步的是技术的探索。从技术角度上来看,统计数据应用中存在的各种难题本质上都是技术的局限难题,一旦技术进步难题就会迎刃而解。到目前为止,技术人员已经沿着这一方向进行了包括安全可靠多方计算、区块链在内的众多新技术的探索尝试。而最近兴起的“联邦学习”技术,就是这些新技术中最令人眼前一亮的一种。

联邦学习的崛起,破解统计数据信任难题

毫无疑问,AI技术是人类文明最伟大的科学成就之一。人工智慧改变了人类文明社会风气,但如今AI技术在实际应用落地的过程中也面临着两大瓶颈:一方面,多数企业拥有的“小统计数据”难以聚沙成塔、取长补短;另一方面,对统计数据隐私与安全可靠的日益重视早已成为世界性趋势。而“联邦学习”作为加密的分布式机器学习范式,可以使得各方在不披露原始统计数据的情况下达到共建模型的目的,为应对AI落地困境提供了更多可能性。

2018年伊始,微众银行首席人工智慧官杨强教授就带领人工智慧团队推动构建联邦学习生态,因此在2018年底向IEEE提交联邦学习国际标准获批,目前已经有30多家企业参与其中。随着联邦学习理论研究的深入,微众银行在国内、国际大会上联合多家合作伙伴举办联邦学习研讨会,比如国际顶会IJCAI和NeurIPS,国内计算机学会CCFTF等,吸引了更多研究者加入;基于联邦学习开源软件FATE(Federated AI Technology Enabler)的开源街道社区也渐渐吸纳上百家机构应用和共建。在行业落地方面,微众银行积极推进联邦学习在金融领域更加深入的应用,在风控、反洗钱、智能营销、智慧城市等领域的应用均取得了很好的效果。

联邦学习能够充分的利用参与方的统计数据和计算能力,使多方可以协作构建通用,更健壮的机器学习模型而不需要共享统计数据,在统计数据监管越来越严格的大环境下,联邦学习能够解决统计数据所有权,统计数据隐私,统计数据访问权以及异构统计数据的访问等关键难题,所以自从联邦学习的概念已提出就获得了人工智慧行业的追捧,目前已经在很多行业受到一定的应用,比如国防、电信、移动服务项目、医疗和物联网等。

从整个统计数据产业看,联邦学习可以增加可用统计数据的总量,能很好的解决现存统计数据孤岛的难题;对企业自身而言,

联邦学习成了解决统计数据难题的“金钥匙”。它是解决数据孤岛难题的重要技术,尤其是在当下网络化转型趋势日益明显时,联邦学习可为各行业的智能化升级提供更高效的模型应用,与此同时也是建设联邦智能生态的重要组成部分。

微众银行AI团队发布人工智慧教科书《联邦学习》 打破统计数据孤岛

联邦学习作为新兴的技术范式,能够在统计数据不出本地的前提下,实现安全可靠统计数据模型共建与AI协作。“统计数据不出本地”这一特性可以保证统计数据隐私为保护,而AI联合建模则可以最大程度挖掘统计数据价值,也因此,联邦学习技术近两年来市场呼声极高。但随着技术研究不断深入与行业应用范围日益扩大,市场亟需一本专业性及实用性兼备的“重量级专著”,来帮助机构及从业者快速与系统化地了解联邦学习技术及其相关应用。

因此,《联邦学习》中文版应运而生,该书由电子工业出版社出版,微众银行首席人工智慧官杨强教授及人工智慧部刘洋、程勇、康焱、陈天健、于涵等多位人工智慧领域顶级专家历时两年,共同撰写而成。该书凝聚了杨强教授团队的多年学术成果和工程经验,是国际首部全面、系统论述联邦学习的中文著作,剖析了了面向统计数据安全可靠和隐私为保护机器学习学术成果和应用案例,统计数据孤岛和统计数据为保护难题破解之法。一方面对联邦学习的整体构架、技术原理、重要价值进行了系统化介绍,另一方面也全面分享了微众银行在联邦学习领域的深厚积累。

我们相信这本书的顺利问世,既标志着由微众银行AI团队带领构建的联邦学习生态影响力正进一步棋扩大,也预示着联邦学习这一技术在走向成熟,未来势必将出现两个全领域合作的联邦生态,建立起安全可靠有效的“统计数据联盟”,释放统计数据无限价值,在为保护使用者个人隐私的与此同时,实现全社会风气的智慧变革。正如《联邦学习》中文版的译者之一,联邦学习技术最早的布道者,国际人工智能界领军人物杨强教授说的那样:“联邦学习作为下一代人工智慧大规模协作的基础,迎合了技术和社会风气的需求,将承担起人工智慧在发展和应用中的重任。”

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务