光熙论坛第766期:基于进化稀疏模型的单细胞转录组降噪方法研究

2022-05-18 09:56

主讲人:刘翘铭,哈工大计算学部生物信息研究中心博士研究生

时间:2022年5月19日  14:00-15:00

地点:腾讯会议 ID:551-944-375

研究方向:单细胞测序,转录组,数据降噪,稀疏表示

内容简介:单细胞RNA测序可以在单细胞分辨率下测量基因的表达水平,这与测量基因平均表达水平的批量RNA技术相比是一个巨大的进步。但是scRNA-seq技术中普遍存在的drop-out问题造成基因表达矩阵存在大量数据噪声,部分基因间关联性被噪声掩盖或影响,盲目的挖掘噪声数据往往会由于大量噪声而使下游分析结果退化,掩藏真正的表达关系。鉴于以上问题,提出了一种针对单细胞转录组的进化稀疏降噪算法,该算法基于细胞间的基因调控关系构建了一个稀疏表示模型,并设计基于非支配排序遗传的优化框架。该框架考虑了细胞间的拓扑关系和基因表达的多样性,迭代搜索全局最优解,从而学习到Pareto最优细胞-细胞关系矩阵。最后,使用学习的细胞间稀疏关系模型来提高数据质量和降低数据噪声。将scESI应用于真实的scRNA-seq数据集,发现scESI不仅可以在可视化中成功地对细胞类型进行进一步分类和分离,而且提高了细胞分化轨迹和差异表达基因识别等下游分析任务的性能。此外,scESI成功地恢复了干细胞分化过程中标记基因的表达变化趋势,并可以发现新的细胞类型和潜在的生物学调控过程。