近日,来自纽约基因组中心、哥伦比亚大学等机构的研究团队在science发表了rna测序应用的最新研究成果,文章题为“genetic regulatory variation in populations informs transcriptome analysis in rare disease”。研究发现,rna测序数据有助于发现罕见的基因变异,同时,研究团队开发了一种新的方法,能够通过分析两个等位基因的表达失衡来诊断罕见疾病。
转录组数据可以帮助解释稀有基因变异的影响。该文章第一作者、scripps科学转化研究所pejman mohammadi表示,通过表达变异分析(aneva)可以量化基因变异。该研究利用不同等位基因的rna表达作为基因组的功能读数。在罕见疾病中,罕见的基因变异通常出现在一个拷贝上。研究团队对携带多种特定罕见基因变异的群体都进行了分析检测,观察亲本拷贝之间有多少基因变异是基因组可以承受的。例如,与父亲的基因拷贝相比,来自母体的基因拷贝更容易表达,其中任何一个基因都可能有表达突变。
虽然这种变化并不一定能够说明哪种变体可能导致哪种疾病,但可以突出显示部分基因以供进一步分析。10月10日,发表在science的文章中,该研究团队展示了将新方法应用于70位孟德尔肌肉疾病患者的rna-seq数据,不仅帮助确定了病例中确切的致病基因变异,并确诊了数个潜在的新病例。
基于aneva在基因型组织表达(gtex)数据中的应用结果,该方法具有较强的鲁棒性,且与基因的选择性约束相关。利用从gtex数据中得到的参考数据,表明aneva-dot可以被纳入罕见疾病诊断策略中,以更有效地使用rna-测序数据。
等位基因特异性表达,也称为等位基因失衡,此前已用于鉴定罕见的基因变异及其作用。美国斯坦福大学bio-x病理学教授stephen montgomery表示:“该研究提供了一种新型工具,可用于了解某些疾病的潜在致病基因。这项研究非常有意义,因为虽然有许多已知的罕见基因变异,但是很难确定是哪些变异起作用。这项最新研究第一个真正提出了一种能够更严格地识别那些变异类型模式的方法”。
mohammadi提到,大多数等位基因之间具有相同的表达,但有些不是这样。通过对多个基因型组织表达数据集进行等位基因特异性表达分析,就能确定可以预期的遗传变异。根据该分析获取的任何异常数值,都可能对应着罕见变异。
加利福尼亚大学圣地亚哥分校研究员joe gleeson表示:“利用gtex数据帮助鉴定孟德尔疾病基因是一个有趣的想法。gtex是一个庞大的数据集,了解其中的基因数据与人类健康的相关性非常有必要。”
同时,该研究方法也存在一定局限性,仍需要改进。目前,该方法仅被证明适用于肌肉疾病,肌肉恰好是gtex采取的样本组织,这种方法能否用于非gtex的采样组织还不确定,在其他疾病类型的适用性也是个未知数。此外,这种方法只适用于高表达基因的子集,其中大约一半的基因在特定的细胞中表达。mohammadi认为:“如果要真正找到最终的变体,需要进行另外的下游分析。” 该研究并没有对所有未确诊的患者进行随访,仍需要一段时间才能确认组中的致病变异。”
目前,该研究团队正在与圣地亚哥rady儿童医院等医院合作,以进一步完善该方法。研究人员已将其用于跨越多种不同表型的稀有疾病样本,包括神经系统疾病、肌肉疾病等多种疾病,将对不同类型的罕见疾病产生广泛的影响。
参考资料:
1.rna-seq data helps focus search for rare variants
2.genetic regulatory variation in populations informs transcriptome analysis in rare disease