学术交流

首页 / 学术交流 / 学术讲座 /

学术交流

“统计大讲堂”第193讲回顾:基于排列比较的动态损伤分类研究

2022-06-01

5月26日上午,“统计大讲堂”系列讲座第一百九十三讲举行。本次讲座采用线上会议的方式,邀请匹兹堡大学统计系成玉教授作题为“Dynamic Impairment Classification Through Arrayed Comparisons”的报告。本次讲座由统计学院王星教授主持,统计学院孙韬等教师与众多学生参与本次讲座。

王星首先介绍了主讲人的相关信息。成玉是匹兹堡大学统计系教授。她于2006年获得威斯康星大学麦迪逊分校统计学博士学位,主持了多项美国国家自然基金会与美国国立卫生研究院的科研项目,涉及新冠、阿尔茨海默症、艾滋病和心血管疾病等诸多生物、心理、脑科学领域。同时,她是《Lifetime Data Analysis》和《Journal of Statistical Research》的副主编。她的主要研究方向为:动态治疗策略、因果推断、疾病分类、风险评估和筛查、多结局事件分析。

成玉首先从一个多中心队列研究出发,指出认知障碍的临床诊断通常基于6项神经生理学评分,并介绍了经典的Multivariate Normative Comparisons(MNC)分类方法。该方法通过构建检验统计量对认知障碍进行分类,同时考虑6项评分之间的关联性,从而可以有效控制familywise error rate(FWER)。然而,该方法只适用于简单的截面数据,没有考虑到纵向数据中多次随访间的关联性,因此可能导致type I error inflation。此外,针对正在开展中的队列研究,由于未来随访次数具有不确定性,研究者还需要考虑如何在随访过程中动态诊断认知障碍,同时有效控制FWER。因此,成玉团队提出了新颖的基于MNC的动态损伤分类方法。

接下来,针对随访次数已知的历史纵向数据,成玉提出了新的Longitudinal MNC(LMNC)方法,将传统MNC的横向设置扩展到了纵向设置,并介绍了新设置下的检验过程。

继而,针对随访次数未知的进展中纵向研究,成玉介绍了动态排列比较方法(Dynamic Arrayed Comparison,DAC)。该方法在LMNC的基础之上,使用双模型法从历史纵向数据中估计未来随访次数,并证明了检验统计量服从卡方分布,同时能够很好的控制FWER。此外,针对真实数据不服从正态分布的情况,成玉提出了一套新的permutation test算法,并在数值模拟中验证了该算法的稳定性与有效性。最终,成玉将新方法应用于一项大规模多中心队列研究,取得了优秀的分类效果。该方法的代码已于Shiny平台公开,供广大研究者使用。

最后,在提问交流环节,在线师生积极参与讨论。成玉对如何判断预测结果是否准确和变量的选取进行了更加深入的讲解。