|
理論群體遺傳學(xué)之中性檢驗 |
1969 年木村資生提出的“中性理論”假說使經(jīng)典的達(dá)爾文自然選擇理論受到了很大的沖擊?!爸行岳碚摗币云鋰?yán)密的數(shù)學(xué)理論,在分子演化領(lǐng)域占據(jù)了重要地位。近年來的研究發(fā)現(xiàn)大量的受自然選擇作用的分子水平證據(jù)。演化過程中的,選擇的作用的大小檢測成為分子演化重要的議題。我將在這里介紹中性檢驗的理論和方法。
演化論是科學(xué)史上的重大發(fā)現(xiàn),在西方思想上占有重要的地位。達(dá)爾文因其對自然選擇驅(qū)動的演化理論深入研究,而推動了自哥白尼以來的西方思想史上的第二次革 命:哥白尼的日心說把地球從宗教的束縛中回歸太陽系中;達(dá)爾文的把自認(rèn)為高尚的人類回歸到地球生命的隊伍(Ayla,2009)。達(dá)爾文的自然選擇理論以 其“物競天擇,適者生存”的原則改變?nèi)藗儗ψ匀坏恼J(rèn)識,也因其“沒有設(shè)計者的設(shè)計”而飽受宗教勢力的打壓和限制。
上個世紀(jì) 60年代,隨著分子生物學(xué)的興起和技術(shù)的應(yīng)用,演化理論的也進(jìn)入了分子時代。1966年,美國芝加哥大學(xué)的 Richard Lewontin和Jack Huby開創(chuàng)了分子演化的電泳研究。他們在實驗中觀測到全新的現(xiàn)象:果蠅個體中的氨基酸突變很高,傳統(tǒng)的突變理論無法如此之高的變異,達(dá)爾文的自然選擇理論似乎在分子水平失效了(Lewontin &Hubby, 1966)。經(jīng)過多年思索的日本學(xué)者木村資生于1968年在Nature上撰文提出中性突變假說,并完美的解釋了 Lewontin和Huby的實驗結(jié)果。木村的中性進(jìn)化理論因其基本觀念的革新和高度的數(shù)量化而迅速發(fā)展,占據(jù)了分子演化的大部分領(lǐng)域(Kimura, 1969,1983)。同時 Linus Pauling和Emile Zuckerkandl的分子鐘( molecular clock)理論也為中理論提供了有力的支撐。演化生物學(xué)就形成了的分子水平的中性演化理論和宏觀水平的自然選擇的現(xiàn)代達(dá)爾文理論。
木村資生的中性的理論提出后,也有新的個例在分子水平被檢測出受到自然選擇的作用。分子水平的自然選擇雖然很弱,但不是沒有。1983年,美國的 Kreitman將DNA測序技術(shù)應(yīng)用于果蠅的研究,發(fā)現(xiàn)了受到自然選擇作用的位點(Keitman,1983)。之后, 不斷有新的發(fā)現(xiàn)來支撐自然選擇理論,達(dá)爾文理論的正在慢慢地復(fù)蘇。
理論群體遺傳學(xué)的模型中,在DNA水平對檢驗檢測自然選擇作用是否存在的方法主要有兩類:種內(nèi)多態(tài)性檢驗和種間分歧度檢驗。前者以Tajima的D檢驗為代表,后者的方法大都以選擇中性和種內(nèi)、種間的演化速率一致的假設(shè)為前提。這些檢測方法基本上都以選擇中性為前提,通過隨機理論和統(tǒng)計方法和分析DNA數(shù)據(jù) 來檢驗自然選擇的作用。因此,這些方法也被統(tǒng)稱為“中性檢驗(neutrality test)”。這些檢驗方法為演化生物學(xué)、人類遺傳學(xué)等提供了數(shù)據(jù)分析支持和理論預(yù)測。下面我將介紹幾種常用的中性檢驗的方法.
1. Tajima的D檢驗(Tajima D test)
在隨機交配群體中,一個符合中性條件的基因的遺傳變異度有θ=4Nμ來決定(N為有效群體大小,μ為每一代的突變率)。有兩種常用的方法估計θ,第一種是在n條序列的樣本中,多態(tài)性位點數(shù)K,其期望值為E(K)=Lθa, L是序列中的位點數(shù),a=(1/1+1/2+....+1/n)(Watterson, 1975), 故θ可由θw=S/(L*a)來估計。第二種是對n條序列的任意兩條序列比較后得到的核苷酸差異的平均比例之的期望值θ,把θ作為一個估計值,記為θt(Tajima, 1983)。Tajima在1989年得出這兩種θ的估計在中性理論模型下是無偏差的(事先假定,群體中沒有選擇、重組、分化,且群體恒定)。如果模型的 假設(shè)不成立,則θ 的兩個估計值會有偏差,兩個估計值之間的差異為檢測嚴(yán)格中性模型失效的因素和機制提供了信息。Tajima(Tajima,1989)構(gòu)建了D檢驗
這里,SE為標(biāo)準(zhǔn)誤差。在失效的中性模型中,mean(D)=0, Var(D)=1。Tajima建議采用標(biāo)準(zhǔn)正態(tài)分布和β分布來確定D是否顯著不同于0。
Tajima 的D檢驗的統(tǒng)計顯著性可能與幾種不同的解釋相容。一個負(fù)D值表明存在凈化選擇(purifying selection)或群體中有輕微分離的有害突變。不過,負(fù)D值也可能是由于群體的擴張引起的。正D值可解釋為平衡選擇將突變保持在平衡頻率,不過也有 可能是一個群體收縮導(dǎo)致的。Tajima的方法作為第一個基于種內(nèi)多態(tài)性的檢驗,而被廣泛引用。
2. Fu-Li檢驗(Fu-li D test)和Fay-Wu檢驗(Fay-Wu H test)
在n條序 列中,一個多態(tài)位點上的核苷酸的突變率為r(r= 1, 2, ... , n-1)。樣本中的所觀測到的突變分布稱為位點頻譜(site frequency spectrum)。 通常,可采用親緣很近的外群(outgroup)來追溯祖先的狀態(tài)及其祖先序列的分化情況 。符云新和李文雄(Fu & Li,1993)把突變分為家系樹的內(nèi)枝(ηE)的突變和外枝的突變(ηL),相應(yīng)地構(gòu)建了一下統(tǒng)計量
a=(1/1+ 1/2+.....+1/n-1), SE為標(biāo)準(zhǔn)差。Fu和Li認(rèn)為群體中的有害突變傾向于近期產(chǎn)生,位于樹的外枝;內(nèi)枝上的突變多中性。他們還構(gòu)建了若干類似的檢驗,這些檢驗的效力取決于有選擇的情況下,檢驗中所用的兩個θ值的差異度。Fu-Li檢驗采用溯祖理論(Coalescent theory), 比較了變異在不同演化時間上的分布,因而比Tajima的D檢驗更靈敏(Fu,1997),是比較常用的檢驗的方法。
Fay和Wu提出了一種類似Fu-Li的思路,構(gòu)建了θ的估計量
這里Si 是位點i上的突變數(shù)目。他們定義一個統(tǒng)計量H=θt-θH.在嚴(yán)格中性假設(shè)下,該統(tǒng)計量的期望值為0。在這里θt用以下公式估算
,使得中頻的突變對θt貢獻(xiàn)最大,而高頻的突變對θH貢 獻(xiàn)最大。這樣,F(xiàn)ay-Wu檢驗比較了高頻和中頻的突變。在選擇中性的假設(shè)下,位點的頻譜分布呈L型——低頻的突變更具普適性,而高頻的則很少見。當(dāng)中性 突變與某個受正選擇作用的基因緊密連鎖時,這個突變可能因選擇的作用而轉(zhuǎn)變成高頻突變,這樣“好的”等位基因就被選則固定下來。這個中性突變的過程被稱為 “遺傳躍遷(genetics hitchhiking)”詳見群體遺傳學(xué)原理(Hartl and Clark, 2007)。Fay和Wu認(rèn)為,高頻突變過剩(顯著的負(fù)H值)是遺傳躍遷效應(yīng)的獨特性質(zhì)。Fay-Wu檢驗需要利用外群序列作為參考來推斷分離位點的祖先,及祖先的衍生序列位點的多態(tài)性。最近,Wu Chung-I的學(xué)生Zeng Kai 結(jié)合Fu-Li的D檢驗和Fay-Wu的H的思路,結(jié)合基因組數(shù)據(jù)的特征,做了一些列的推廣(Zeng et al,, 2006; Zeng, 2007a,2007b)。
3. McDonald-Kritman檢驗(MK test)
中性理論假說認(rèn)為種內(nèi)多態(tài)性和種間分歧是演化過程的兩個階段,兩個演化過程都是由中性突變的隨機漂變固定所致。因而,如果同義突變(synonymous substitution)和非同義的突變(nonsynonymous substitution)都是中性的,那么種內(nèi)的同義突變和非同義突變的多態(tài)性之比應(yīng)該和種間同義突變和非同義突變差異的比例是相同的。McDonald-Kreitman 檢驗(McDonald & M. Kreitman, 1991)就是針對的這個預(yù)測構(gòu)建的。McDonald-Kritman檢驗思路簡潔,計算也簡單,且在檢驗中性理論假設(shè)方面有著重要地位。
McDonald和Kreitman依據(jù)同義突變和非同義突變對近源物種的蛋白質(zhì)編碼基因中的可變位點進(jìn)行分類。他們定義了固定位點和多態(tài)位點風(fēng)別作為種間分歧和種內(nèi)差異的標(biāo)志。固定位點是種間分歧有明顯的堿基差異而種內(nèi)個體間卻無堿基差異的位點;多態(tài)位點是種內(nèi)個體間堿基對有差異的位點。在中性假說的條件下,McDonald-Kreitman構(gòu)建了如下統(tǒng)計檢測量
E(nf)/E(sf)=E(np)/E(sp)
這里nf是非同義突變位點也是固定位點的位點數(shù);sf是同義突變位點也是固定位點的位點數(shù);np是非同義突變位點也是多態(tài)位點的位點數(shù);sp是同義突變位點也是多態(tài)位點的位點數(shù)。當(dāng)物種間有選擇作用時,上式的平衡就被打破了,這種不平衡可用統(tǒng)計學(xué)的檢驗來估算不平衡比例的顯著性,而這個顯著性可作為群體中選擇強度的依據(jù)。
4. Hudson-Kreitman-Aquadé檢驗(HKA test)
Hudson-Kreitman-Aquadé檢驗的原理和MK檢驗很相近,HKA檢驗對兩個以上的近源物種中的多個不連鎖基因的序列數(shù)據(jù),用此來檢驗這 些等位基因上的多態(tài)性和分歧是否一致。HKA的基本原理是基因的突變率與其多態(tài)性和分歧度成正比(Hudson et al, 1987)。
在L個等位基因中,設(shè)有物種A和B的基因i上的分離位點數(shù)分別為Sai和Sbi,它們在基因i上的差異數(shù)是Di。Sai和Sbi是中多態(tài)性的標(biāo) 度;Di是種間分歧的標(biāo)度。Hudson等人假定Sai, Sbi和Di是獨立的正態(tài)變量,并在中性條件下推導(dǎo)這三個變量的期望值和方差,以構(gòu)建這三個變量的擬合優(yōu)度的統(tǒng)計檢驗量Sai,Sbi和Di。
.HKA檢驗計算了種間和種內(nèi)差異的卡方平方和,再檢驗實驗結(jié)果是否與中性條件下的的期望和方差相一致,它對數(shù)據(jù)的要求比較高,計算過程也比較復(fù)雜。
關(guān)于中性理論的各種檢驗均以中性理論的零假設(shè)為前提來構(gòu)建統(tǒng)計檢驗量來檢測選擇的有無。這些檢驗方法以嚴(yán)密的數(shù)學(xué)理論作為工具,在不同的序列數(shù)據(jù)類別中,各個檢驗?zāi)軝z測到是否有選擇的存在。當(dāng)然,面對的日新月異生物學(xué)序列數(shù)據(jù)和演化過程中各種不同驅(qū)動因子,單一的檢驗無法完全勝任檢測選擇的任務(wù),多種檢測的結(jié)合是必要的,同時新方法發(fā)展也是很迫切的。
趣聞: Fumio Tajima(田 嶋文生,たじま ふみお)是日本群遺傳學(xué)家,他是根井正利的學(xué)生。在隨根井正利讀研究生期間,Tajima在最初階段,根井正利給了他一個“習(xí)題 ”,1983年,Tajima的完成這個“習(xí)題”文章(Tajima, 1983)的成了溯祖理論的開山之作(另外還有美國的Hudson, R. R和英國Kingman,三人獨立發(fā)現(xiàn)coalescent,Kingmang的貢獻(xiàn)最大),1989年的博士畢業(yè)論文(Tajima 1989)發(fā)展了種內(nèi)多態(tài)性多檢測選擇,開創(chuàng)了中性檢驗的新局面。之后他回到日本,現(xiàn)在是東京大學(xué)的生物系的教授。他也是很典型的他日本學(xué)者,個人主頁的 介紹基本不用英文,大都是日語。
Population Genetics 我們大陸譯為“群體遺傳學(xué)”,不知道日本為什么譯為“集団遺伝學(xué)”,臺灣的大都稱“種群遺傳學(xué)“?
參考文獻(xiàn)
* Francisco J. Ayala, (2009),One hundred fifty years without Darwin are enough!, Genome Res. 19: 693-699
* Fay, J. C. and C.-I Wu,(2000) Hitchhiking under positive Darwinian selection. Genetics 155: 1405-1413
* Fu, Y. X., (1997) Statistical tests of neutrality of mutations against population growth, hitchhiking and background selection. Genetics 147: 15–925.
* Fu, Y. X., and W. H. Li, (1993) Statistical tests of neutrality of mutations. Genetics 133: 693–709.
* Hudson, R. R., M. Kreitman and M. Aguadé, (1987) A test of neutral molecular evolution based on nucleotide data. Genetics 116: 153–159
* Tajima, F., (1983) Evolutionary relationship of DNA sequenc es in finite populations. Genetics 105: 437–460.
* Tajima, F., (1989) Statistical method for testing the neutral mutation hypothesis by DNA polymorphism. Genetics 123: 585–595.
* Kimura, Motoo (1968). Evolutionary rate at the molecular level. Nature 217: 624–626.
* Kimura, Motoo (1983). The Neutral Theory of Molecular Evolution. Cambridge University Press
* Lewontin, R. C.; J. L. Hubby (1966). "A molecular approach to the study of genic heterozygosity in natural populations. II. Amount of variation and degree of heterozygosity in natural populations of Drosophila pseudoobscura". Genetics 54: 595-609
* Kreitman, M., (1983) Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature 304:412-411.
* McDonald, J. H., and M. Kreitman, 1991 Adaptive protein evolution at the adh locus in Drosophila. Nature 351: 652–654.
* Watterson, G. A., (1975) On the number of segregating sites in genetical models without recombination. Theor. Popul. Biol. 7:256–276.
* Zeng, Kai, S.H., Shi, Y.X. Fu, and C.-I Wu. (2006) Statistical Tests for Detecting Positive Selection by Utilizing High Frequency SNPs. Genetics 74:1431-1439.
* Zeng, K., S. Mano, S. Shi and C.-I Wu. ( 2007a) Comparisons of site- and Haplotype-Frequency methods for detecting positive selection. Molec. Biol. Evol. 24(7): 1562-1574.
* Zeng, K., S. Shi and C.-I Wu.( 2007b) Compound tests for the detection of hitchhiking under positive selection. Molec. Biol. Evol. 24(8):1898-1908.
(這筆記我學(xué)習(xí)理論群體遺傳學(xué)的一個心得和總結(jié),主要參考了以上的文獻(xiàn),LI WH的“Molecular Evolution”, Hartl and Clark的“Principle of Population Genetics”, Warren Ewens的“Mathematical Population Genetics”。 我在這里的理解可能會有些錯誤和偏差,請參考最新文獻(xiàn)和參考文獻(xiàn)以正視聽。)
|
|
評分
-
查看全部評分
版權(quán)聲明:本文內(nèi)容來源互聯(lián)網(wǎng),僅供畜牧人網(wǎng)友學(xué)習(xí),文章及圖片版權(quán)歸原作者所有,如果有侵犯到您的權(quán)利,請及時聯(lián)系我們刪除(010-82893169-805)。
|