生物医学统计创新引智教学与研究暨第九届临床评价方法与应用国际研讨会
2019-07-10
2019年7月5日至6日,“生物医学统计创新引智教学与研究暨第九届临床评价方法与应用国际研讨会”在中国人民大学成功举办。本届研讨会由中国人民大学及北京生物医学统计与数据管理研究会联合主办。会议邀请了美国伊利诺伊大学香槟分校统计系瞿培勇教授、美国圣路易斯华盛顿大学生物统计学刘磊教授、美国明尼苏达大学统计学院杨宇泓教授、美国耶鲁大学公共卫生学院张和平教授进行专题报告,来自全国各高校、医院和企业界的100余位专家学者和学生代表参加了会议。
7月5日上午,中国人民大学统计学院院长王晓军教授为会议作开幕式致辞,对与会者的到来表示热烈的欢迎。5日上午,研讨会由美国乔治华盛顿大学统计系教授,中国人民大学统计与大数据研究院特聘教授胡飞芳主持,伊利诺伊大学香槟分校统计系数据科学创始教授瞿培勇报告。瞿教授报告的主题为Deep Learning and Individualized Multilayer Tensor Learning for Medical Imaging Data。瞿教授的报告分为两部分。在第一部分中,瞿教授以Deep Learning 近年的飞速发展为背景,详细介绍了DNN和CNN的理论以及其在医学影像数据的计算机辅助诊断(Classification, Detection and Recognition, Image segmentation 以及 Registration)中的应用。第二部分,在多模态乳腺癌影像数据中TMVs信号随机分布的异质性模式带来困难的背景下,瞿教授介绍了其提出的Multilayer Tensor Learning 方法,该方法将异质性纳入到higher-order tensor decomposition中,利用subject-wise imaging features和多模态信息来有效地预测疾病状态,并且介绍了能够实现scalable computing的Bi-level Block Improvement Algorithm。瞿教授报告了该法在模拟和实证中的优异表现,该方法优于现有的其他竞争方法。
7月5日下午,研讨会由中国人民大学统计学院教授,北京生物医学统计与数据管理研究会副会长,中国现场统计研究会生物医学统计分会秘书长张景肖主持,美国圣路易斯华盛顿大学生物统计学刘磊教授报告。刘磊教授针对零膨胀连续数据的统计分析方法进行了精彩的报告。刘教授首先介绍了零膨胀连续数据,指出其在医学、经济学等领域中广泛存在,为数据的统计分析提出了相应的要求和挑战。接着,刘教授回顾了许多分析零膨胀连续数据的统计方法,包括two-part model、Tobit model、zero-inflated Tobit model等。在下一部分,刘教授介绍了对重复测量零膨胀连续数据的建模,其中为了解决对同一个体重复测量数据的相关性问题,使用了随机效应。此外,刘教授还展示了在上一部分介绍的模型中加入随机效应的情形。接着,刘教授介绍了纵向零膨胀连续数据和生存数据的联合模型,并结合实际数据予以说明。
7月6日上午,研讨会由中国人民大学统计学院副院长,北京生物医学统计与数据管理研究会监事长李扬主持,美国明尼苏达大学统计学院杨宇泓教授报告。杨宇泓教授围绕Model selection and combination for estimating treatment effects专题进行报告。杨教授强调同一治疗对不同个体的效果可能因基线协变量不同而存在异质性,这是个性化医疗的前提。为此,杨教授介绍了模型选择的方法,并对交叉验证方法进行扩展,提出一种更灵活的估计治疗效果的模型选择方法Treatment Effect Cross-Validation (TECV),利用模拟研究和临床试验数据对该方法展开了进一步说明。之后,针对模型选择方法存在不稳定性的问题,杨教授介绍了模型平均方法,表明当模型选择困难时,模型平均方法通常比单个模型能提供更准确和更稳定的估计。最后,杨教授对该领域未来的研究方向进行了展望(如High-dimensional data,Effective pairing of observations,Model selection diagnostics specifically for treatment effect estimation)。
7月6日下午,研讨会由首都医科大学公共卫生学院副院长,全国工业统计教学研究会健康医疗大数据学会会长,北京生物医学统计与数据管理研究会副会长郭秀花主持,美国耶鲁大学公共卫生学院统计与科学合作中心主任张和平教授报告。张和平教授围绕Recursive Partitioning, tree and forest专题对逻辑回归、分类树以及随机森林进行了阐释。张教授认为许多科学问题都可以简化成对两组变量之间的关系进行建模的过程,而回归方法旨在量化这些关系,因此在不能够全面了解这些变量之间关系的情况下,非参数分类和回归方法就显得特别有用。张教授在本次会议上介绍了基于树的方法,其基本思想是将观测数据的潜在异构域划分为更均匀、更同质的子区域,以便在每个子区域内可以轻松描述两组变量之间的关系,之后张教授还通过真实例子为大家解释了如何识别这些子区域以及如何解释这些树。至此,本届生物医学统计创新引智教学与研究暨第九届临床评价方法与应用国际研讨会圆满落下帷幕。
本届研讨会促进了国际生物医学统计知名专家与国内青年学者的交流互动,希望通过大家的不懈追求和努力,一起推动中国生物医学统计事业的发展。