新闻公告

首页 / 新闻公告 / 中心新闻 /

新闻公告

我中心研究员张景肖及学生李向杰(第一作者)在《Nature Communications》发表论文

2020-07-07

作者介绍

李向杰,2016.09-2019.06中国人民大学统计学院博士,2017.11-2018.11获国家留学基金委公派资助在美国宾夕法尼亚大学交流学习,目前在中国医学科学院阜外医院做博士后与合作导师胡盛寿院士从事心血管疾病相关数据的研究。

导师以及合作导师

张景肖 (博导):中国人民大学统计学院教授、应用统计科学研究中心研究员,研究方向:高维统计,函数型数据,生物、医学数据分析;

Mingyao Li(合作导师、通讯作者):美国宾夕法尼亚大学生物统计系教授,研究方向:人类疾病的相关基因研究,基因组数据的统计分析。

论文名称

Deep learning enables accurate clustering with batch effect removal in single-cell RNA-seq analysis

发表信息

Li, X., Wang, K., Lyu, Y. et al. Deep learning enables accurate clustering with batch effect removal in single-cell RNA-seq analysis. Nat Commun 11, 2338 (2020). https://doi.org/10.1038/s41467-020-15851-3

论文页面

摘要

单细胞测序技术使得我们能够从细胞层次识别细胞类型和状态,但是不断增加的细胞数量和批次效应给计算带来了挑战。据此,我们提出一种无监督深度学习嵌入算法DESC,该算法通过迭代地优化聚类目标函数对scRNA-seq数据进行聚类。当批次间的批次效应小于生物学意义的差异时,DESC通过迭代的自学习逐渐消除批次效应。DESC输出的聚类概率不仅可以精确地对细胞进行聚类还可以解释细胞的伪时间结构。综合评价显示DESC可以在聚类精度和稳定性之间取得适当的平衡,且不需要显式的批次信息设定就可以消除批处理效应,此外DESC只需要很小的内存并且可以利用高效的GPU进行计算。随着单细胞研究规模的不断增长,DESC将为生物医学研究人员提供一个解开复杂细胞异质性很好的工具。

https://eleozzr.github.io/desc/