我中心研究员杨翰方团队在人工智能顶级会议NeurIPS发表论文
2023-11-14
我中心研究员杨翰方教授与学生马宇恒、张涵在NeurIPS2023发表论文,提出了使用公开数据辅助局部差分隐私学习。针对非参数回归问题,文章从理论与实验两个角度研究了公开数据带来的优势。
论文题目
Decision Tree for Locally Private Estimation with Public Data
文章摘要
我们提出利用少量公开数据来增强局部差分隐私(LDP)估计的性能。具体来说,我们提出一种名为局部差分隐私决策树(LPDT)的非参数回归方法。我们首先利用公开数据构建一个决策树划分,然后基于该划分进行局部隐私的估计。从理论角度来看,在常见的非参数假设下,我们证明了LPDT满足局部差分隐私要求,并且在极小极大意义下具有最佳的收敛速度。从实验角度来看,我们在模拟数据和真实数据上进行了比较,展示了LPDT相对于其他前沿方法的卓越性能。研究表明,少量公开数据就可以显著提升隐私估计的性能。因此,对于数据收集过程来说,选择同时收集少量公开和隐私数据而非大量隐私数据更具经济性。
作者介绍
马宇恒,统计学院2021级博士研究生。
张涵,统计学院2022级硕士研究生。
蔡宇超,统计学院2023届博士生。
杨翰方(通讯作者),中国人民大学统计学院教授,应用统计科学研究中心研究员。
会议介绍
NeurIPS全称Conference on Neural Information Processing Systems,是全球最负盛名的机器学习与人工智能领域学术会议,由 NeurIPS 基金会主办。大会讨论的内容包含深度学习、计算机视觉、大规模机器学习、学习理论、优化、稀疏理论等众多细分领域。
论文发表截图