“统计大讲堂”系列讲座第四十七讲
2018-07-06
6月29日,我院举办的“统计大讲堂”系列讲座第四十七讲在明德主楼1016会议室举行。本次讲座邀请了美国宾夕法尼亚大学佩雷尔曼医学院的J.Richard Landis教授和李明瑶教授,我院张景肖教授主持了本次学术报告会。
J.Richard Landis 教授是宾夕法尼亚大学佩雷尔曼医学院生物统计学、流行病学和信息学系生物统计学教授和生物统计学部门主任,同时担任沃顿商学院统计学教授。他在领导NIH资助的多中心研究网络数据协调中心(DCCs)方面拥有丰富的经验,并且在对重复测量和纵向分类数据的统计学方法,流行病学研究,对心血管、眼科、呼吸科、精神病、肾脏和泌尿科研究的复杂抽样调查及应用等领域,在同行评议的科学文献中合著发表了180多篇文章。
李明瑶教授是宾夕法尼亚大学佩雷尔曼医学院生物统计学、流行病学和信息学系生物统计学教授。她于1996年获得南开大学数学学士学位,于2005年获得密歇根大学生物统计学博士学位,并于2006年加入宾夕法尼亚大学生物统计学系。李教授是美国统计协会的Fellow,也是国际统计学会的当选成员。她的主要研究领域是统计遗传学和基因组学。她发表了140多篇同行评议的文章,其中包括在Science, Nature Genetics和The Lancet(柳叶刀)等顶级期刊的第一作者论文。
Landis教授的报告题目是“使用一致性聚类方法的亚组发现:在深度表型数据中的应用”。许多疾病的不同亚群都有其独特的表型;识别具有多种结果风险差异的患者亚型对于促进健康改善和精准医疗策略都有重要意义。对此Landis教授介绍了一种分层聚类方法:对样本量为N的样本,首先将基准变量聚类到I个子域,然后将I个子域做为选定指标,在R(如1000)个随机选取的大小为80%N的子样本中重复使用平均连锁方法的K均值聚类算法。基于“类内模糊对比例”(PAC)的评估标准顺序生成K="2,…,10类的平均一致性分数,并据此选取最优K。将该方法应用于多学科慢性盆腔疼痛(MAPP)研究网络的骨盆疼痛、尿急、频率及人体疼痛位点的深度表型数据,得到了具有高度可重复性的K" = 3个患者亚型。
李明瑶教授的报告题目是“单细胞RNA测序对细胞异质性的统计建模”。在单细胞水平上测量基因表达的技术突破使生物学家能更好地了解细胞异质性;但由于脱落事件的频发和转录爆发现象,得到的通常是噪声数据。对RNA差异性剪接的检测和成块组织数据中的细胞类型解卷积,李教授分别提出了转录剪接的单细胞分析(SCATS)和多主体单细胞参考(MuSiC)的统计方法。通过聚合外显子得到更多测序片段信息,对真实表达水平、脱落概率和放大偏差进行建模,得到映射包含片段数的分布从而对差异剪接状态进行假设检验;通过比较正常和患病个体之间的细胞类型组成,特定细胞类型的差异性表达分析和eQTL分析提出了加权非负最小二乘(W-NNLS)的方法及相应的评估标准。对老鼠皮质细胞的应用从假阳性率、敏感性等方面显示了SCATS方法的优势;对Fadista et al. 成块RNA测序数据等的应用说明了MuSiC方法的有效性。
报告结束后,在场师生们就报告中提出的问题,与两位教授进行了热切的讨论。