0 引言
大数据时代,数据的安全性和隐私性受到了越来越多的重视和关注[1]。欧盟及我国都分别相继通过了《一般数据法案》《欧洲数据保护通用条例》《中华人民共和国网络安全法》等相关法案,以保护数据的安全和隐私。
南方电网公司“十四五”数字化规划明确提出:电力智慧投资将以项目储备库为基础,通过输入约束条件和投资分配参数,并结合规划部门的配网规划数据、基建部门的基建结算数据和财务部门的财务数据,运用机器学习训练生成的投资预测模型,自动生成投资计划项目及费用估算建议。但是,目前的电力投资系统依赖集中式的方式训练模型,要求训练涉及的多方数据和训练过程必须在数据中心。在此过程中,各部门自有数据中的隐私信息可能会被泄露。此外,各部门出于数据安全和隐私保护的需求,不可能将自有数据上传到数据中心。因此,如何在确保各方数据安全和隐私的情况下打破数据孤岛、共同训练模型,成为了急需解决的挑战。
联邦学习使得机器学习或深度学习算法能从不同组织或部门的大量数据中获得更好的经验[2]。这种技术允许多个组织或部门在数据不直接共享的情况下协作完成模型的联合训练[3]。具体来讲,各组织或部门的私有自有数据可以不离开本地,通过本地模型参数的更新和全局模型参数的聚合,在确保各自数据隐私性和安全性的情况下,联合训练一个共享的全局模型。因此,联邦学习被视为解决数据孤岛和打破数据壁垒的有效可行技术[4]。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004285。
作者信息:
杨东宁1,2,谢潇睿1,吉志坤3,姬维维3
(1.云南电网有限责任公司 信息中心,云南 昆明650011;2.西南林业大学 大数据与智能工程学院,云南 昆明650224;
3.云南云电同方科技有限公司,云南 昆明650220)

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。