“统计大讲堂”系列讲座第一百三十一讲顺利举行
2020-10-14
10月10日上午,“统计大讲堂”系列讲座第一百三十一讲在明德主楼1016会议室举行。中国科学院数学与系统研究院统计中心副主任孙六全受邀作题为“A Non-marginal Variable Screening Method for the Varying Coefficient Cox Model”的报告。统计学院教师、应用统计科学研究中心研究员林存洁、孙韬,师资博士后廖军参加讲座。本次讲座由统计学院教授许王莉主持。
许王莉首先介绍了报告人的相关信息。孙六全是中国科学院数学与系统科学研究院二级研究员,博士生导师,中国科学院数学与系统研究院统计中心副主任。主要研究方向为生存分析、生物统计、复发事件和纵向数据分析、各种删失数据分析。在国内外核心刊物发表学术论文150多篇,其中包括统计顶级杂志JASA和Biometrika 8篇。主持了国家自然科学基金重点基金1项,并先后主持或参与了973重大项目,国家自然科学基金重大项目和面上项目等18项。
孙六全由新药研发上市过程中的统计学分析切入,介绍了著名的Cox Model,该模型以生存结局和生存时间为因变量,是生存分析领域常用的分析方法。标准的Cox Model中回归系数为常数,而孙六全以对卵巢癌数据的分析为例说明,现实中回归系数可能随时间变化,从而自然地引出Varying Coefficient Cox Model。他指出该模型中的协变量具有重要意义,并在筛选协变量时需要考虑变量间的联合效应,因此选择非边际的变量筛选方法(NOVAS)。
基于NOVAS方法,孙六全介绍了考虑协变量动态影响和超高维变系数情况下的相关研究,以及用局部拟合计算估计量的方法,在此过程中提出了改进后的KNOVAS方法并证明了该方法的科学性和有效性。为快速实现筛选方法,他还介绍了一种有效的迭代算法IGHT,并详细阐述了其运算过程和性质。
孙六全随后给出了常系数、变系数和复杂协变量等不同情况下的模拟研究结果,并将KNOVAS方法与其他现有方法进行对比,证明了KNOVAS方法可以有效筛选出重要变量,并在某些情况下更具优势。他以卵巢癌数据的分析为例,展示了该方法在现实问题中的有效应用。此外,他提出上述方法值得推广到诸如比例优势模型等其他回归模型。
提问交流环节,现场师生积极参与研讨。孙六全耐心地解答疑问,并就样本量要求和模型优势等问题作了进一步阐释。
本次讲座内容充实,条分缕析,展现了生存分析领域统计学方法的优化研究和实际应用,给予师生很多学术启发。未来,“统计大讲堂”系列将继续推出更多高质量讲座,敬请关注。