新闻公告

首页 / 新闻公告 / 中心新闻 /

新闻公告

“统计大讲堂”系列讲座第一百二十五讲顺利举行

2020-07-20

7月18日上午,“统计大讲堂”第一百二十五讲——“青椒说”系列讲座第六期顺利举行。讲座以“Biomarker-guided heterogeneity analysis of genetic regulations via multivariate sparse fusion”为主题,由统计学院副教授孙怡帆主讲。此次讲座为线上讲座,师生通过腾讯会议参与研讨。统计学院教授李扬主持本次讲座。本次讲座正值年度优秀大学生夏令营之际,讲座内容不仅开阔了同学们的视野,更帮助拓展了同学们未来的研究方向。

李扬首先介绍了主讲人的相关信息。孙怡帆是中国人民大学统计学院副教授、博士生导师、数理统计系系主任、全国工业统计学教学研究会第九届理事会理事,主要研究方向为复杂数据分析、网络分析、最优化方法等,在Statistics in Medicine、统计研究等学术期刊发表论文20余篇,主持国家和省部级等项目6项。

孙怡帆首先介绍了当下吸引众多关注的一个问题——复杂疾病如癌症、糖尿病、老年痴呆症的异质性,说明了她及其合作团队的研究动机。随后,她从一个关于乳腺癌不同基因表达的研究案例出发,指出异质性的定义已经由外在特征发展到了分子水平,并阐释了传统研究工作常运用的无监督学习层次聚类方法。她与团队在本次研究中注重视角的变换,即研究视角从单一的基因数据转变为探究基因的调控模式以及影响基因表达值高低的因素之间的联系。

孙怡帆表示,此课题的关键在于建立多个高维因变量与多个高维自变量之间回归模型。本次研究的目标是通过数据驱动的方法找到不同的亚组以及对应的基因调控模式。她指出,传统工作主要依靠医学上的研究范式,人为主观地将人群分为不同亚组,该方法虽然在医学上合理,但受先验知识的限制,难以得出良好的分组结果或解释不同组之间的差异。而她与团队的研究工作依靠病人的身体数据、临床特征以及CNV基因矩阵,优化传统的回归模型以及分类方法。

孙怡帆简要介绍了其研究过程,包括模型的建立、模型中的参数引入以及引入原因、研究中的过程优化、方法改进以及对模型所得结果的评价,并将新建立的研究模型与传统方法进行对比。最后,她再次强调新的研究方法适用范围更加广泛,能够用于识别隐含亚组结构、解决不同亚组重叠与不重叠矩阵的相关问题。

在提问交流环节中,在线师生积极参与互动。孙怡帆耐心详细地解答了每一个问题,并表示后续可以对此课题进行更加深入的研究。关于用统计方法解决生物医学问题,李扬指出有些优化算法确实是为解决生物医学领域的实际问题而提出,但优化算法的研究和应用不局限于生物医学领域。