西部妇幼医学研究院 部门动态详细

我院陈路研究员团队基于贝叶斯混合模型
推断单细胞选择性多聚腺苷酸化位点的新算法SCAPE

生命体的遗传中心法则(genetic central dogma)包括DNA转录为RNA,RNA翻译成蛋白质的过程。在转录过程中,前体mRNA(pre-mRNA)加工为成熟的mRNA需要经过5’端加帽、内含子剪接和3’端加工等步骤,其中3’端加工包括转录本切割和多聚腺苷酸化(cleavage and polyadenylation, CPA)。在pre-mRNA不同位点进行切割和多聚腺苷酸化,从而产生编码序列(CDS)或3’ UTR不同的转录本亚型的现象,称为选择性多聚腺苷酸化(alternative polyadenylation, APA)。APA广泛参与哺乳动物mRNA 的转录后调控,其可通过改变mRNA 3’ UTR长度,选择性的获得或丢失RBP、miRNA或lncRNA的结合位点,影响 mRNA 的稳定性、翻译效率、输出和亚细胞定位等功能,以实现对基因表达的精细调控。因此,APA在胚胎发育、细胞命运决定和肿瘤发生等生理和病理过程中发挥着重要作用。随着单细胞测序技术的发展,10x和Microwell-seq等基于3’富集的单细胞测序方法具有3’偏好性,为揭示单细胞水平APA异质性提供了可能。然而,由于单细胞转录组测序(scRNA-seq)仅有少量测序序列直接包含多聚腺苷酸化(pA)位点,因此目前基于单细胞数据推断pA位点的方法在准确推断pA位点的位置,分离重叠峰和从技术噪声中区分弱信号方面仍然存在局限性。

为解决上述难题,陈路研究员团队及合作者芬兰阿尔托大学计算机系(Aalto University)程路研究员在Nucleic Acids Research(影响因子:16.97)上发表了题为SCAPE: a mixture model revealing single-cell polyadenylation diversity and cellular dynamics during cell differentiation and reprogramming的文章。(文章链接https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac167/6548409?login=false)科研团队利用二代测序建库过程中的插入片段长度分布的先验信息,开发了一个巧妙的贝叶斯混合模型, 对单细胞测序过程中重要随机因素如插入片段长度以及polyA长度进行合理建模, 使用最大期望算法进行参数推断, 开发了一个新的单细胞APA分析工具——SCAPE(Single Cell Alternative Polyadenylation using Expectation-maximization),旨在更为准确且灵敏地分析单细胞APA事件。与当前方法相比,SCAPE 在各个方面都表现出卓越的性能。

利用SCAPE,研究团队基于多个单细胞数据集建立并全景式地分析了小鼠单细胞APA图谱,揭示了APA在红细胞发育、细胞重编程和组织器官间潜在的调控作用。此外,研究团队发现APA 亚型与 3’ UTR 中 miRNA 结合的表达具有较高的相关性。总的来说,陈路研究员团队在单细胞水平上解析了APA在肿瘤发生和造血干细胞红系分化中的重要调控作用,为APA的功能研究奠定了基础。

陈路研究员目前为四川大学华西第二医院/生物治疗国家重点实验室研究员,博士生导师,从事综合生物信息、机器学习和生物实验研究转录和选择性剪接在造血干细胞分化、癌症发生的多组学研究。在Science、Cell等国际期刊发表论文35篇,文章被引用4000余次。自2016年回国加入四川大学以来,作为通讯作者(包括共同)已在Cell Host Microbe (2021)、Cell Research(2021)、Signal Transduction and Targeted Therapy(2021、2022)、Nucleic Acids Research(2021、2022)等期刊发表多篇研究论文。