2019年12月,国际人工智能顶级学术会议神经信息处理系统大会NeurIPS 2019(Conference and Workshop on Neural Information Processing Systems 2019)即将于加拿大温哥华隆重召开。大会期间,谷歌、微众银行、卡耐基梅隆大学、新加坡南洋理工大学等机构将联合举办关于联邦学习技术及应用的国际研讨会(Workshop on Federated Learning for Data Privacy and Confidentiality)。从该国际研讨会近日揭晓的论文收录情况来看,联邦学习这一人工智能子领域已经受到国内外知名研究机构及企业的关注与重视。
联邦学习国际社区范围进一步扩大
据研讨会主席、微众银行人工智能首席科学家范力欣介绍,随着人工智能技术成功突破算法与算力上的限制,如何连接“数据孤岛”和保护数据隐私,成为人工智能在各行各业应用落地所必须解决的难题。“联邦学习”(Federated Learning)作为一种加密的分布式机器学习范式,可以使得各方在不披露原始数据的情况下达到共建模型的目的。即在不违反数据隐私保护法规的前提下,连接数据孤岛,建立性能卓越的共有模型。
近两年来,联邦学习在学术研究、标准制定、行业落地等方面一路高歌猛进,成为人工智能领域引人注目的方向之一。今年8月,IJCAI 2019首届联邦学习国际研讨会的成功召开标志了联邦学习国际社区的正式成立,联邦学习进入了一个新的阶段。此次在NeurIPS 2019中举办的联邦学习主题的研讨会则在参与人数、投稿数量、研讨深度、应用广度等方面进一步提升,吸引更多国际研究者与从业者的关注。
据统计,此次研讨会共收到68篇投稿论文,来自美、中、英、德、芬兰、新加坡、日本、印度、以色列、沙特阿拉伯等17个国家和地区,其中不乏哈佛、普林斯顿、康奈尔、麻省理工等国际名校与研究机构,以及谷歌、华为、腾讯、微众银行等知名企业。数据显示,美国与中国投稿最多,占投稿总数70%以上。在近几年联邦学习的研究中,以谷歌研究院为代表的技术流派关注消费者端(C端)移动设备上的隐私保护问题,而国内以微众银行 AI团队为代表的技术流派,比较看重企业端(B端)跨机构跨组织大数据合作场景。事实上此次研讨会的投稿分布也正体现了在联邦学习这一人工智能新方向上,中美的领先地位。
理论研究与应用探索齐头并进
在被接收的33篇论文中,从入选论文作者的机构分布来看,卡耐基梅隆大学、谷歌、微众银行、腾讯占比最高。哈佛大学、耶鲁大学、康奈尔大学、清华大学、北京大学、香港科技大学、微软、Facebook、腾讯等海内外知名研究机构与企业均占一席之地。
入选论文不仅包含对联邦学习的理论研究,更重要的是呈现了在实际应用中的探索成果。其中最受评委青睐的来自卡耐基梅隆大学的论文《Think Locally, Act Globally: Federated Learning with Local and Global Representations》就提出结合本地与全局的方式,降低联邦学习通讯开销,提升学习效率,该方法即使在参与方拥有非同质数据的情况下仍然有效。无独有偶,国内微众银行AI团队的论文《A Communication Efficient Vertical Federated Learning Framework》提出针对纵向联邦,降低通信开销,进而提升学习效率的方法,该方法在理论分析与实验验证中被证明行之有效。通信开销的降低与学习效率的提升将为更大范围的工业化奠定基础,对此的研究来源于应用,也将在实际应用中产生巨大价值。此外,谷歌与卡耐基梅隆大学的合作论文《Mitigating the Impact of Federated Learning on Client Resources》提供了一个对联邦学习各种方法进行客观全面评价的基准框架(benchmark framework)。
大咖云集共话联邦学习未来
值得一提的是,此次研讨会汇聚了众多学术大咖,其中欧洲人工智能领军人物、欧洲人工智能联盟(ECCAI)与国际人工智能学会(AAAI)院士Boi Faltings教授的论文《Federated Learning with Bayesian Differential Privacy》从理论分析与实验结果两方面,证明了贝叶斯差分隐私联邦学习的有效性。
此次研讨会还邀请了八位特邀嘉宾,发表联邦学习主题报告:微众银行首席人工智能官、第四范式联合创始人、香港科技大学讲席教授杨强,谷歌语音识别技术研发带头人Francoise Beaufays及谷歌研究院研究员Daniel Ramage,网络安全领域著名专家、加州大学伯克利分校教授Dawn Song及助理教授Raluca Ada Popa,阿姆斯特丹大学机器学习首席教授、高通技术副总裁Max Welling,卡耐基梅隆大学助理教授Ameet Talwalkar,中国科学院计算技术研究所泛在计算系统研究中心主任陈益强教授。
联邦学习领域的顶尖学者与从业者将从理论研究与实践探索出发,把联邦学习与多个行业领域的最新技术结合起来,为应对用户隐私保护、数据安全与AI落地的矛盾提供更加全面有效的解决方法。相信随着联邦学习的深入研究与广泛落地,AI的更大规模行业应用未来可期。
相关阅读:
疑似中国移动内部文件证实:4G、宽带资费涨价,取消不限流量套餐
互联网金融领域两项标准通过团体标准立项评审