分子演化理论对医学组学信息的解读
407 人阅读发布时间:2016-06-07 11:44
运用分子演化理论系统解读高通量组学信息,是现代生物信息学的另一个重要方向。著名的进化生物学家Theodosius Dobzhansky曾这样描述演化理论的重要性:“Nothing in biology makes sense except in the 1ight of evolution"。随着基因组学研究的深入,人们逐渐认识到分子演化理论对深入理解生物过程与人类疾病的重要意义:一方面,越来越多的证据表明,分子演化理论可用于解释海量组学数据中所蕴含的种种复杂模式;另一方面,在分子演化的理论框架下,通过生物信息学与比较基因组学研究,可为探索人类复杂疾病的分子机制、并从更深层次上理解这一机制的形成原因提供独特的切入点。下面仅以三个示例简要说明分子演化理论在基因组医学研究中的应用。
1.如前所述,GWAS研究已完成对上百种人类复杂疾病与表型的遗传易感因子鉴定。在这些研究中,与早期发病的复杂疾病相比(如儿童孤独症),针对晚期发病的复杂疾病、或针对个体用药差异表型(如华法林的个体用药差异)的GWAS研究,进展相对较快。这一现象可能与自然选择有关:对于早期发病的复杂疾病,与疾病相关的遗传易感突变往往会影响适应度(fitness),造成突变在人群中的分布频率较低;而对于晚期发病的疾病,或与个体用药相关的表型差异,影响其易感性的遗传突变可能不会对适应度造成较大影响,因此可以在人群中保持相对较高的频率。
而从GWAS设计中可以看出,易感突变在人群中存在的频率越低,显著性地鉴定出该突变所需要的样本数越大,总实验设计所需的成本就越高。这样,在预算成本一定的情况下,针对这些受自然选择强度不等的表型开展GWAS研究,成功发现易感突变的可能性自然会表现出较大差别。
2.恒河猴作为人类近缘物种,在生物医学领域具有重要的研究价值,但恒河猴的基因结构注释较差,外显子-内含子边界主要通过生物信息学预测完成。如前文所述,通过检测跨越多个外显子的恒河猴转录组测序片断,发现先前。Ensembl数据库注释中2947个转录本的外显子-内含子边界存在问题。那么,这些修正是否准确昵?对于真核生物,基因区包含了内含子区域和外显子区域。与内含子区域相比,由于外显子区域对于维持蛋白质一级结构和转录本稳定性等方面具有重要作用,在自然选择的长期作用下,它们具有较强的跨物种保守性,表现为更高的跨物种保守性分值(PhastCons Score)。
这一特征为基于转录组测序数据的基因结构修正提供了独立的评估指标:通过生物信息学的方法,比较外显子-内含子边界的PhastCons值分布,可发现根据修正前的基因模型,PhastCons值在外显子-内含子边界处缓慢下降,而根据修正后的基因结构,可在外显子-内含子边界处发现明显的下降趋势(图3-4-1)。这样,通过生物信息学方法研究PhastCons值在外显子-内含子区域的分布,可评估基因结构修正的准确性提供新证据。
3.通过比较人类与非人灵长类模式动物在基因组成、表达模式等方面的差异,可为研究人类特异行为与疾病提供独特的切入点。近年来,针对恒河猴的研究有望通过阐明人-猴病毒感染差异的分子基础,为病毒的有效防治提供新靶点;通过比较基因组学,可以鉴定以从头模式起源的人类特异蛋白,而这些蛋白可用于解释人类在一些复杂疾病发病中所表现出的独特调控。
此外,通过针对多物种、多组织的剪切谱分析,可发现某些类型的可变剪切调控显示出物种差异大于组织差异的模式与基因表达模式不同(组织差异大于物种差异),提示这些可变剪切调控可能在较大程度上决定了人类特异的性状,为研究人类特异的疾病和行为提供了新线索。总之,基于分子演化理论,运用生物信息学方法研究基因调控与人类特异性状的因果关系,可为探索人类复杂疾病提供独特的切入点。
来源:北京标准物质网 www.biaowu.com
来源:中国微生物菌种网 www.bnbio.com