我中心研究员金勇进及学生刘晓宇就线上线下调查数据的融合问题在《统计研究》发文
2022-01-26
我中心研究员金勇进及学生刘晓宇就线上、线下调查数据的融合问题在《统计研究》发表论文。该研究以基于倾向得分伪权数的校准估计为例,探讨了具体的解决方法及变量选择问题,并通过模拟进行验证。
论文题目
线上、线下调查数据的融合问题——以基于伪设计的校准为例
文章摘要
在当前调查环境和互联网发展的背景下,线上、线下混合调查的方式得到广泛应用。如何将两方面数据相融合,减少信息浪费,合理利用数据资源,得到有效且精度高的估计结果,是大数据背景下调查数据推断面临的严峻挑战。本文针对线上样本是非概率样本、线下样本是概率样本的情况,提出了进行数据融合的基本思路:一是对非概率样本进行“概率性检验”,进而将两类数据结合在一起进行统计推断;二是利用概率样本中提供的信息,对非概率样本进行“伪随机化”。本文针对第二种思路,以基于倾向得分伪权数的校准估计为例,探讨了具体的解决方法及变量选择问题,并通过模拟进行验证。
作者介绍
金勇进,中国人民大学应用统计科学研究中心研究员,统计学院教授,博士生导师,研究领域为抽样调查。
刘晓宇,中国人民大学统计学院硕博连读在读博士生,主要研究方向为抽样调查。在统计学、经济学、数学等领域核心期刊发表8篇论文。