理論群體遺傳學(xué)之中性檢驗(yàn) |
演化論是科學(xué)史上的重大發(fā)現(xiàn),在西方思想上占有重要的地位。達(dá)爾文因其對(duì)自然選擇驅(qū)動(dòng)的演化理論深入研究,而推動(dòng)了自哥白尼以來的西方思想史上的第二次革 命:哥白尼的日心說把地球從宗教的束縛中回歸太陽系中;達(dá)爾文的把自認(rèn)為高尚的人類回歸到地球生命的隊(duì)伍(Ayla,2009)。達(dá)爾文的自然選擇理論以 其“物競(jìng)天擇,適者生存”的原則改變?nèi)藗儗?duì)自然的認(rèn)識(shí),也因其“沒有設(shè)計(jì)者的設(shè)計(jì)”而飽受宗教勢(shì)力的打壓和限制。 上個(gè)世紀(jì) 60年代,隨著分子生物學(xué)的興起和技術(shù)的應(yīng)用,演化理論的也進(jìn)入了分子時(shí)代。1966年,美國芝加哥大學(xué)的 Richard Lewontin和Jack Huby開創(chuàng)了分子演化的電泳研究。他們?cè)趯?shí)驗(yàn)中觀測(cè)到全新的現(xiàn)象:果蠅個(gè)體中的氨基酸突變很高,傳統(tǒng)的突變理論無法如此之高的變異,達(dá)爾文的自然選擇理論似乎在分子水平失效了(Lewontin &Hubby, 1966)。經(jīng)過多年思索的日本學(xué)者木村資生于1968年在Nature上撰文提出中性突變假說,并完美的解釋了 Lewontin和Huby的實(shí)驗(yàn)結(jié)果。木村的中性進(jìn)化理論因其基本觀念的革新和高度的數(shù)量化而迅速發(fā)展,占據(jù)了分子演化的大部分領(lǐng)域(Kimura, 1969,1983)。同時(shí) Linus Pauling和Emile Zuckerkandl的分子鐘( molecular clock)理論也為中理論提供了有力的支撐。演化生物學(xué)就形成了的分子水平的中性演化理論和宏觀水平的自然選擇的現(xiàn)代達(dá)爾文理論。 木村資生的中性的理論提出后,也有新的個(gè)例在分子水平被檢測(cè)出受到自然選擇的作用。分子水平的自然選擇雖然很弱,但不是沒有。1983年,美國的 Kreitman將DNA測(cè)序技術(shù)應(yīng)用于果蠅的研究,發(fā)現(xiàn)了受到自然選擇作用的位點(diǎn)(Keitman,1983)。之后, 不斷有新的發(fā)現(xiàn)來支撐自然選擇理論,達(dá)爾文理論的正在慢慢地復(fù)蘇。 理論群體遺傳學(xué)的模型中,在DNA水平對(duì)檢驗(yàn)檢測(cè)自然選擇作用是否存在的方法主要有兩類:種內(nèi)多態(tài)性檢驗(yàn)和種間分歧度檢驗(yàn)。前者以Tajima的D檢驗(yàn)為代表,后者的方法大都以選擇中性和種內(nèi)、種間的演化速率一致的假設(shè)為前提。這些檢測(cè)方法基本上都以選擇中性為前提,通過隨機(jī)理論和統(tǒng)計(jì)方法和分析DNA數(shù)據(jù) 來檢驗(yàn)自然選擇的作用。因此,這些方法也被統(tǒng)稱為“中性檢驗(yàn)(neutrality test)”。這些檢驗(yàn)方法為演化生物學(xué)、人類遺傳學(xué)等提供了數(shù)據(jù)分析支持和理論預(yù)測(cè)。下面我將介紹幾種常用的中性檢驗(yàn)的方法. 1. Tajima的D檢驗(yàn)(Tajima D test) 在隨機(jī)交配群體中,一個(gè)符合中性條件的基因的遺傳變異度有θ=4Nμ來決定(N為有效群體大小,μ為每一代的突變率)。有兩種常用的方法估計(jì)θ,第一種是在n條序列的樣本中,多態(tài)性位點(diǎn)數(shù)K,其期望值為E(K)=Lθa, L是序列中的位點(diǎn)數(shù),a=(1/1+1/2+....+1/n)(Watterson, 1975), 故θ可由θw=S/(L*a)來估計(jì)。第二種是對(duì)n條序列的任意兩條序列比較后得到的核苷酸差異的平均比例之的期望值θ,把θ作為一個(gè)估計(jì)值,記為θt(Tajima, 1983)。Tajima在1989年得出這兩種θ的估計(jì)在中性理論模型下是無偏差的(事先假定,群體中沒有選擇、重組、分化,且群體恒定)。如果模型的 假設(shè)不成立,則θ 的兩個(gè)估計(jì)值會(huì)有偏差,兩個(gè)估計(jì)值之間的差異為檢測(cè)嚴(yán)格中性模型失效的因素和機(jī)制提供了信息。Tajima(Tajima,1989)構(gòu)建了D檢驗(yàn) 這里,SE為標(biāo)準(zhǔn)誤差。在失效的中性模型中,mean(D)=0, Var(D)=1。Tajima建議采用標(biāo)準(zhǔn)正態(tài)分布和β分布來確定D是否顯著不同于0。 Tajima 的D檢驗(yàn)的統(tǒng)計(jì)顯著性可能與幾種不同的解釋相容。一個(gè)負(fù)D值表明存在凈化選擇(purifying selection)或群體中有輕微分離的有害突變。不過,負(fù)D值也可能是由于群體的擴(kuò)張引起的。正D值可解釋為平衡選擇將突變保持在平衡頻率,不過也有 可能是一個(gè)群體收縮導(dǎo)致的。Tajima的方法作為第一個(gè)基于種內(nèi)多態(tài)性的檢驗(yàn),而被廣泛引用。 2. Fu-Li檢驗(yàn)(Fu-li D test)和Fay-Wu檢驗(yàn)(Fay-Wu H test) 在n條序 列中,一個(gè)多態(tài)位點(diǎn)上的核苷酸的突變率為r(r= 1, 2, ... , n-1)。樣本中的所觀測(cè)到的突變分布稱為位點(diǎn)頻譜(site frequency spectrum)。 通常,可采用親緣很近的外群(outgroup)來追溯祖先的狀態(tài)及其祖先序列的分化情況 。符云新和李文雄(Fu & Li,1993)把突變分為家系樹的內(nèi)枝(ηE)的突變和外枝的突變(ηL),相應(yīng)地構(gòu)建了一下統(tǒng)計(jì)量 a=(1/1+ 1/2+.....+1/n-1), SE為標(biāo)準(zhǔn)差。Fu和Li認(rèn)為群體中的有害突變傾向于近期產(chǎn)生,位于樹的外枝;內(nèi)枝上的突變多中性。他們還構(gòu)建了若干類似的檢驗(yàn),這些檢驗(yàn)的效力取決于有選擇的情況下,檢驗(yàn)中所用的兩個(gè)θ值的差異度。Fu-Li檢驗(yàn)采用溯祖理論(Coalescent theory), 比較了變異在不同演化時(shí)間上的分布,因而比Tajima的D檢驗(yàn)更靈敏(Fu,1997),是比較常用的檢驗(yàn)的方法。 Fay和Wu提出了一種類似Fu-Li的思路,構(gòu)建了θ的估計(jì)量 這里Si 是位點(diǎn)i上的突變數(shù)目。他們定義一個(gè)統(tǒng)計(jì)量H=θt-θH.在嚴(yán)格中性假設(shè)下,該統(tǒng)計(jì)量的期望值為0。在這里θt用以下公式估算 ,使得中頻的突變對(duì)θt貢獻(xiàn)最大,而高頻的突變對(duì)θH貢 獻(xiàn)最大。這樣,F(xiàn)ay-Wu檢驗(yàn)比較了高頻和中頻的突變。在選擇中性的假設(shè)下,位點(diǎn)的頻譜分布呈L型——低頻的突變更具普適性,而高頻的則很少見。當(dāng)中性 突變與某個(gè)受正選擇作用的基因緊密連鎖時(shí),這個(gè)突變可能因選擇的作用而轉(zhuǎn)變成高頻突變,這樣“好的”等位基因就被選則固定下來。這個(gè)中性突變的過程被稱為 “遺傳躍遷(genetics hitchhiking)”詳見群體遺傳學(xué)原理(Hartl and Clark, 2007)。Fay和Wu認(rèn)為,高頻突變過剩(顯著的負(fù)H值)是遺傳躍遷效應(yīng)的獨(dú)特性質(zhì)。Fay-Wu檢驗(yàn)需要利用外群序列作為參考來推斷分離位點(diǎn)的祖先,及祖先的衍生序列位點(diǎn)的多態(tài)性。最近,Wu Chung-I的學(xué)生Zeng Kai 結(jié)合Fu-Li的D檢驗(yàn)和Fay-Wu的H的思路,結(jié)合基因組數(shù)據(jù)的特征,做了一些列的推廣(Zeng et al,, 2006; Zeng, 2007a,2007b)。 3. McDonald-Kritman檢驗(yàn)(MK test) 中性理論假說認(rèn)為種內(nèi)多態(tài)性和種間分歧是演化過程的兩個(gè)階段,兩個(gè)演化過程都是由中性突變的隨機(jī)漂變固定所致。因而,如果同義突變(synonymous substitution)和非同義的突變(nonsynonymous substitution)都是中性的,那么種內(nèi)的同義突變和非同義突變的多態(tài)性之比應(yīng)該和種間同義突變和非同義突變差異的比例是相同的。McDonald-Kreitman 檢驗(yàn)(McDonald & M. Kreitman, 1991)就是針對(duì)的這個(gè)預(yù)測(cè)構(gòu)建的。McDonald-Kritman檢驗(yàn)思路簡(jiǎn)潔,計(jì)算也簡(jiǎn)單,且在檢驗(yàn)中性理論假設(shè)方面有著重要地位。 McDonald和Kreitman依據(jù)同義突變和非同義突變對(duì)近源物種的蛋白質(zhì)編碼基因中的可變位點(diǎn)進(jìn)行分類。他們定義了固定位點(diǎn)和多態(tài)位點(diǎn)風(fēng)別作為種間分歧和種內(nèi)差異的標(biāo)志。固定位點(diǎn)是種間分歧有明顯的堿基差異而種內(nèi)個(gè)體間卻無堿基差異的位點(diǎn);多態(tài)位點(diǎn)是種內(nèi)個(gè)體間堿基對(duì)有差異的位點(diǎn)。在中性假說的條件下,McDonald-Kreitman構(gòu)建了如下統(tǒng)計(jì)檢測(cè)量 E(nf)/E(sf)=E(np)/E(sp) 這里nf是非同義突變位點(diǎn)也是固定位點(diǎn)的位點(diǎn)數(shù);sf是同義突變位點(diǎn)也是固定位點(diǎn)的位點(diǎn)數(shù);np是非同義突變位點(diǎn)也是多態(tài)位點(diǎn)的位點(diǎn)數(shù);sp是同義突變位點(diǎn)也是多態(tài)位點(diǎn)的位點(diǎn)數(shù)。當(dāng)物種間有選擇作用時(shí),上式的平衡就被打破了,這種不平衡可用統(tǒng)計(jì)學(xué)的檢驗(yàn)來估算不平衡比例的顯著性,而這個(gè)顯著性可作為群體中選擇強(qiáng)度的依據(jù)。 4. Hudson-Kreitman-Aquadé檢驗(yàn)(HKA test) Hudson-Kreitman-Aquadé檢驗(yàn)的原理和MK檢驗(yàn)很相近,HKA檢驗(yàn)對(duì)兩個(gè)以上的近源物種中的多個(gè)不連鎖基因的序列數(shù)據(jù),用此來檢驗(yàn)這 些等位基因上的多態(tài)性和分歧是否一致。HKA的基本原理是基因的突變率與其多態(tài)性和分歧度成正比(Hudson et al, 1987)。 在L個(gè)等位基因中,設(shè)有物種A和B的基因i上的分離位點(diǎn)數(shù)分別為Sai和Sbi,它們?cè)诨騣上的差異數(shù)是Di。Sai和Sbi是中多態(tài)性的標(biāo) 度;Di是種間分歧的標(biāo)度。Hudson等人假定Sai, Sbi和Di是獨(dú)立的正態(tài)變量,并在中性條件下推導(dǎo)這三個(gè)變量的期望值和方差,以構(gòu)建這三個(gè)變量的擬合優(yōu)度的統(tǒng)計(jì)檢驗(yàn)量Sai,Sbi和Di。 .HKA檢驗(yàn)計(jì)算了種間和種內(nèi)差異的卡方平方和,再檢驗(yàn)實(shí)驗(yàn)結(jié)果是否與中性條件下的的期望和方差相一致,它對(duì)數(shù)據(jù)的要求比較高,計(jì)算過程也比較復(fù)雜。 關(guān)于中性理論的各種檢驗(yàn)均以中性理論的零假設(shè)為前提來構(gòu)建統(tǒng)計(jì)檢驗(yàn)量來檢測(cè)選擇的有無。這些檢驗(yàn)方法以嚴(yán)密的數(shù)學(xué)理論作為工具,在不同的序列數(shù)據(jù)類別中,各個(gè)檢驗(yàn)?zāi)軝z測(cè)到是否有選擇的存在。當(dāng)然,面對(duì)的日新月異生物學(xué)序列數(shù)據(jù)和演化過程中各種不同驅(qū)動(dòng)因子,單一的檢驗(yàn)無法完全勝任檢測(cè)選擇的任務(wù),多種檢測(cè)的結(jié)合是必要的,同時(shí)新方法發(fā)展也是很迫切的。
參考文獻(xiàn) * Francisco J. Ayala, (2009),One hundred fifty years without Darwin are enough!, Genome Res. 19: 693-699 * Fay, J. C. and C.-I Wu,(2000) Hitchhiking under positive Darwinian selection. Genetics 155: 1405-1413 * Fu, Y. X., (1997) Statistical tests of neutrality of mutations against population growth, hitchhiking and background selection. Genetics 147: 15–925. * Fu, Y. X., and W. H. Li, (1993) Statistical tests of neutrality of mutations. Genetics 133: 693–709. * Hudson, R. R., M. Kreitman and M. Aguadé, (1987) A test of neutral molecular evolution based on nucleotide data. Genetics 116: 153–159 * Tajima, F., (1983) Evolutionary relationship of DNA sequenc es in finite populations. Genetics 105: 437–460. * Tajima, F., (1989) Statistical method for testing the neutral mutation hypothesis by DNA polymorphism. Genetics 123: 585–595. * Kimura, Motoo (1968). Evolutionary rate at the molecular level. Nature 217: 624–626. * Kimura, Motoo (1983). The Neutral Theory of Molecular Evolution. Cambridge University Press * Lewontin, R. C.; J. L. Hubby (1966). "A molecular approach to the study of genic heterozygosity in natural populations. II. Amount of variation and degree of heterozygosity in natural populations of Drosophila pseudoobscura". Genetics 54: 595-609 * Kreitman, M., (1983) Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature 304:412-411. * McDonald, J. H., and M. Kreitman, 1991 Adaptive protein evolution at the adh locus in Drosophila. Nature 351: 652–654. * Watterson, G. A., (1975) On the number of segregating sites in genetical models without recombination. Theor. Popul. Biol. 7:256–276. * Zeng, Kai, S.H., Shi, Y.X. Fu, and C.-I Wu. (2006) Statistical Tests for Detecting Positive Selection by Utilizing High Frequency SNPs. Genetics 74:1431-1439. * Zeng, K., S. Mano, S. Shi and C.-I Wu. ( 2007a) Comparisons of site- and Haplotype-Frequency methods for detecting positive selection. Molec. Biol. Evol. 24(7): 1562-1574. * Zeng, K., S. Shi and C.-I Wu.( 2007b) Compound tests for the detection of hitchhiking under positive selection. Molec. Biol. Evol. 24(8):1898-1908. (這筆記我學(xué)習(xí)理論群體遺傳學(xué)的一個(gè)心得和總結(jié),主要參考了以上的文獻(xiàn),LI WH的“Molecular Evolution”, Hartl and Clark的“Principle of Population Genetics”, Warren Ewens的“Mathematical Population Genetics”。 我在這里的理解可能會(huì)有些錯(cuò)誤和偏差,請(qǐng)參考最新文獻(xiàn)和參考文獻(xiàn)以正視聽。)
|
歡迎光臨 畜牧人 (http://m.ffers.com.cn/) | Powered by Discuz! X3.5 |