1. 程式人生 > >第二章 氨基酸序列的進化演變

第二章 氨基酸序列的進化演變

1、導讀

分子進化的重要原理如基因進化的重複進化(gene duplication)、分子鐘等(moleculer clock)都是通過研究氨基酸序列發現的。

這裡之所以先介紹氨基酸進化的原因:

1)比DNA序列更加保守

2)蛋白質編碼基因的DNA序列的對位排列分析上,需要氨基酸序列矯正

3)氨基酸的進化演變模型比DNA序列簡單的多

本章的重要目的:介紹兩個氨基酸序列間進化距離(evolutionary distance)的統計方法。

研究進化距離的意義:

1)對研究蛋白質進化非常重要

2)可用來構建系統樹並估計分歧時間

在氨基酸序列方面,通常以氨基酸替代數來測定距離,但不同假設下存在不同的測度。

2、氨基酸的差異和不同氨基酸的比例

2.1)最簡單的測度

兩個序列間氨基酸個數差異(nd)。如果所有的氨基酸的個數相同(n),上述差異數就可以用來比較不同序列間的分歧程度。當多重序列比對時候,經常會含有插入缺失,這種情況下計算nd需要去掉插入缺失(間隔,indels),否則不同序列對間相比較時候計算出來的nd沒有意義。nd:number of amino acid differences

2.2)p距離

兩個序列間差異氨基酸所佔的比例.即使n隨著不同序列而變化,但比例值(p)依舊可以用於比較分歧程度,該距離為p距離(p為proportion的縮寫)。公式為:

假設所有的氨基酸位點都是以相同的概率替代,則nd

需遵循二項式分佈,因此其方差為:

n=140,nd位於對角線上,p值位於對角線下。可以看出,物種關係遠時,p值大;物種關係近時,p值小。說明:隨著物種分歧時間增大,氨基酸替代數目也增加。但是p並不嚴格與分歧時間(t)成比列。 下面將給出解釋。

3、 泊松校正和τ距離