“统计大讲堂”系列讲座第三十六讲
2018-03-16
2018年3月15日,我院举办的“统计大讲堂”系列学术报告会第三十六讲在明德主楼1016举行。本次报告邀请清华大学统计学研究中心副主任邓柯博士向我院师生分享他的最新研究。我院尹建鑫副教授主持了本次学术报告会,参加报告会的教师还有许王莉教授、张景肖教授、吕晓玲教授、王星副教授、王菲菲博士。
尹建鑫副教授首先对报告人进行了介绍。邓柯博士2008年获得北京大学统计学博士学位,同年进入哈佛大学统计系从事研究工作,历任博士后、副研究员。2013年加入清华大学丘成桐数学科学中心任助理教授。2015年6月,清华大学成立统计学研究中心,统筹清华大学统计学学科的建设,邓柯博士作为创始成员加入统计学研究中心并担任副主任;2016年12月晋升副教授。邓柯博士的研究兴趣包括统计建模、统计计算、生物信息、文本分析等领域,他的一系列论文发表在国际统计学顶级杂志以及其他领域的顶级杂志。他2008年获得中国概率统计学会颁发的“钟家庆优秀论文奖”,2014年入选“青年千人计划”并当选中国数学会概率统计学会第十届理事会理事。他还获得了“科学中国人2016年度人物”的荣誉称号。
邓柯博士的报告题目是:Bayesian Sufficient Dimension Reduction by Modeling Joint Distributions。邓柯博士首先以一个PCA的例子引入,指出无监督降维方法虽然能提取数据中的主要信息,但这些信息与响应变量间的相关性却不能保证,而有监督降维则不会有这种问题。本次报告所考虑的就是一个充分降维(Sufficient Dimension Reduction)问题。之后邓柯博士回顾了充分降维领域的过往方法的思想及优缺点,如Projection Pursuit、Sliced Inverse Regression、MAVE等频率方法和spLGP、BMM这两种贝叶斯降维方法。
邓柯博士指出现实生活中当解释变量受微小扰动时,响应变量分布不应该变化过大,即条件分布应具有某种连续性。而BMM(贝叶斯混合模型)方法建模后的条件分布没有连续性,受此启发邓柯博士的团队提出对解释变量和响应变量的联合分布建模,将其建成一个Dirichlet process Gaussian mixture model(狄利克雷过程高斯混合模型),由此生成的条件分布就天然具有连续性。模型参数的求解采用Gibbs抽样,针对某些参数由于受约束没有显示分布的问题,邓柯博士采用了一种Dimension Expension的方法来避开这一问题。这种方法首先将其约束放松,扩展到高维空间,求解后再投影到可行域以满足约束。
报告结束后,在场师生对报告中提到的高斯成分数量的选择、贝叶斯方法的收敛速度等问题与邓柯博士进行了交流讨论。