新闻公告

首页 / 新闻公告 / 中心新闻 /

新闻公告

我中心研究员李扬教授及学生在期刊Genome Biology发表论文

2023-11-18

我中心研究员李扬教授及博士生吴明聪在《Genome Biology》发表论文,提出基于混合零膨胀负二项模型的单细胞数据聚类分析方法,能够有效控制表达数据中的技术脱落及批次混杂问题,并创新性地利用惩罚技术实现同步的高度变异基因识别,是探索细胞间的异质性及与异质性机制形成相关的基因表达研究的有力工具。研究结果显示,该方法在异质性和基因识别方面均具有一定优势。

论文题目

ZINBMM:a general mixture model forsimultaneous clustering and gene selection using single-cell transcriptomic data

期刊介绍

《Genome Biology》创刊于2000年,是BioMed Central主办的旗舰期刊,面向生物学和生物医学各领域的重大研究问题,致力于以基因组和后基因组为对象的统计学、计算科学方法研究,是生物统计、生物信息学等领域的顶级期刊,五年影响因子17.4。

文章摘要

Clustering is a critical component of single-cell RNA sequencing (scRNA-seq) data analysis and can help reveal cell types and infer cell lineages. Despite considerable successes, there are few methods tailored to investigating cluster-specific genes contributing to cell heterogeneity, which can promote biological understanding of cell heterogeneity. In this study, we propose a zero-inflated negative binomial mixture model (ZINBMM) that simultaneously achieves effective scRNA-seq data clustering and gene selection. ZINBMM conducts a systemic analysis on raw counts, accommodating both batch effects and dropout events. Simulations and the analysis of five scRNA-seq datasets demonstrate the practical applicability of ZINBMM.

作者介绍

李扬,中国人民大学统计学院教授、博士生导师,研究生院副院长、统计咨询研究中心主任;入选国家级青年人才项目,担任国际统计学会推选会员、中国商业统计学会副会长、中国统计学会常务理事、中国现场统计研究会常务理事、北京生物医学统计与数据管理研究会监事长等;主要从事相关型数据分析, 模型选择与不确定性评价, 潜变量建模, 临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表JASA、JAMA IM、AOAS、Biometrics、Biostatistics、统计研究等期刊论文七十余篇。

吴明聪,中国人民大学统计学院在读博士研究生,主要研究方向为高维数据变量选择、聚类分析等。

马双鸽,耶鲁大学生物统计系教授,国际统计学会推选会员、美国统计学会会士。研究主要集中于生物统计、遗传流行病学、生存分析、高维数据分析等。担任JASA, AISM, Briefings in Bioinformatics等多个国际期刊副主编。已在Nature Genetics、JASA、The Annals of Statistics、Biometrika、Briefings in Bioinformatics等国际权威期刊发表论文数百篇。

吴梦云,上海财经大学统计与管理学院教授;2013年获得中山大学概率论与数理统计博士学位,并于2016年8月至2018年7月在耶鲁大学生物统计系进行博士后研究。主要研究方向为高维数据变量选择、网络模型及整合分析等。目前,已在The Annals of Applied Statistics、Biometrics、Biostatistics、Statistics in Medicine、Bioinformatics等期刊发表多篇学术论文。入选上海市晨光计划、浦江人才以及启明星计划,主持国家自然科学青年基金和面上项目,以及全国统计科学研究重大项目。

论文发表截图