常用的遺傳標記主要有各種血型,各種蛋白質(zhì)的電泳行為,蛋白質(zhì)的氨基酸組成,等位基因和特定的DNA序列等。這些遺傳標記在早期構(gòu)建遺傳圖時,常用作制圖的界標。現(xiàn)在已有很多種作圖的界標,現(xiàn)分述于下:
①限制性片段長度多態(tài)性(RFLPs) 指用某一種限制性內(nèi)切酶切割不同個體的DNA時,會產(chǎn)生長度不同的DNA片段,這反映出不同個體來源的DNA序列有差別,當這些差別發(fā)生在限制性內(nèi)切酶的識別序列中時,限制酶就不能再識別這個切割位置,于是就少了一個切割點,切成的DNA片段也就少了一個,但有一個片段的長度卻增加了。同樣,當DNA的差別造成一個新的識別序列時,限制酶就多了一個切點,切成的片段也就多了一個,但有一個片段的長度縮短了。這種酶切片段數(shù)目和長度的變化,可作為一個個體的DNA序列的標記,通過家系中親代和子代的DNA分析,便可研究其RFLPs的遺傳規(guī)律,此時的RFLPs就相當于等位基因,可以分析其連鎖交換頻率而算出其遺傳距離,作為遺傳圖的作圖界標。人基因組有105以上的RFLPs界標。RFLPs是反映了基因組DNA的等位片段的多態(tài)性。將這種多態(tài)性信息與生物體的某一特定表型或性狀之間的關(guān)系進行連鎖分析,就有可能把決定該表型或性狀的基因定位在遺傳圖的某一位置上。
②微衛(wèi)星DNA多態(tài)界標 在基因組DNA中廣泛分布著單位長度為6~12個核苷酸的串聯(lián)重復序列,這些重復單位以正向(頭—尾)或反向(頭—頭,尾—尾)串聯(lián)成簇。在DNA的某些位置上這種串聯(lián)成簇的重復單位數(shù)目不同。因此,用在串聯(lián)重復序列兩側(cè)切割的限制性內(nèi)切酶酶切后,就會產(chǎn)生重復單位數(shù)目不等的片段。這種數(shù)量可變串聯(lián)重復序列(variablenumber of tandemrepeat,VNTR)的片段長度不同,可作為多態(tài)性界標。
短串聯(lián)重復序列(short tandem repeat,STR)是另一類多態(tài)性界標。STR的重復單元長度為2—6個核苷酸。在不同個體的基因組中,這種重復單元的數(shù)目變異很大,因而比RFLPs和VNTR有更高的多態(tài)性;同時,STR在基因組中的豐度很高,基本上是平均分布并便于用PCR檢測,可以大大提高遺傳制圖的精度。
③單核苷酸多態(tài)(single nucleotide polymorphism,SNP)界標 在一個群體中,基因組內(nèi)某一基因座上可以有兩個或兩個以上的等位基因,這是等位基因的多態(tài)性。同樣,在基因組內(nèi)某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因組內(nèi)特定核苷酸位置上存在兩種不同的核苷酸且其出現(xiàn)頻率大于1%(也有人提出為2%)。換言之,如出現(xiàn)頻率低于1%(或2%),則視作點突變。SNP作為單堿基的置換,在群體中只有兩種等位型可以檢出,就形成雙等位標記(biallelic marker),這種界標在人基因組中可多達300萬個,平均每1 300 bp就會有一個。因此,3到4個這種相鄰的界標構(gòu)成的單倍型(haplotype)就可以有8~16種。由于兩個人的基因組作比較時,平均每1 300個核苷酸中有1個差別,所以這種界標數(shù)目極多,覆蓋密度大,由此可以大大提高基因組作圖和基因定位的精度。
SNP作為一種堿基的置換,大多數(shù)是轉(zhuǎn)換,即兩種嘌呤間和兩種嘧啶間的置換。SNP在CG序列上出現(xiàn)最為頻繁,而且多半是C轉(zhuǎn)換成T,因為C常自發(fā)地脫氧后成為T。SNP可以人為地劃分為兩種,一種是遍布在基因組非編碼序列中的單核苷酸變異;另一種則是分布在基因編碼序列中的SNP,稱之為cSNP(coding SNPs)。cSNP或者是“靜默的”、“同義的”不改變編碼產(chǎn)生的蛋白質(zhì);或者是“非同義的”,會改變編碼產(chǎn)生的蛋白質(zhì)的序列,形成了蛋白質(zhì)的多態(tài)性,在功能上有其效應。可是迄今與疾病等直接相關(guān)的SNP是很罕見的。cSNP同點突變之間的差別只在于其在群體出現(xiàn)的頻率,即上面提到的出現(xiàn)頻率大于1%(2%)的歸為多態(tài),低于1%(2%)的則歸人點突變。
④非多態(tài)的短單一序列作為界標 在構(gòu)建基因組物理圖時可以用非多態(tài)的長度為300 bp左右的單一序列作為界標。常用的有標定位置序列(sequence tagged site,STS)和表達序列標簽(expressed sequence tag,EST)。前者是基因組中的單一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。這種界標可以直接標定在基因組上,并便于用PCR進行驗證。EST是代表一種cDNA分子,也就是代表一個基因,但一種cDNA分子或一個基因可以有不止一個EST。由EST構(gòu)成的圖譜,有助于構(gòu)建轉(zhuǎn)錄圖或基因圖。
①限制性片段長度多態(tài)性(RFLPs) 指用某一種限制性內(nèi)切酶切割不同個體的DNA時,會產(chǎn)生長度不同的DNA片段,這反映出不同個體來源的DNA序列有差別,當這些差別發(fā)生在限制性內(nèi)切酶的識別序列中時,限制酶就不能再識別這個切割位置,于是就少了一個切割點,切成的DNA片段也就少了一個,但有一個片段的長度卻增加了。同樣,當DNA的差別造成一個新的識別序列時,限制酶就多了一個切點,切成的片段也就多了一個,但有一個片段的長度縮短了。這種酶切片段數(shù)目和長度的變化,可作為一個個體的DNA序列的標記,通過家系中親代和子代的DNA分析,便可研究其RFLPs的遺傳規(guī)律,此時的RFLPs就相當于等位基因,可以分析其連鎖交換頻率而算出其遺傳距離,作為遺傳圖的作圖界標。人基因組有105以上的RFLPs界標。RFLPs是反映了基因組DNA的等位片段的多態(tài)性。將這種多態(tài)性信息與生物體的某一特定表型或性狀之間的關(guān)系進行連鎖分析,就有可能把決定該表型或性狀的基因定位在遺傳圖的某一位置上。
②微衛(wèi)星DNA多態(tài)界標 在基因組DNA中廣泛分布著單位長度為6~12個核苷酸的串聯(lián)重復序列,這些重復單位以正向(頭—尾)或反向(頭—頭,尾—尾)串聯(lián)成簇。在DNA的某些位置上這種串聯(lián)成簇的重復單位數(shù)目不同。因此,用在串聯(lián)重復序列兩側(cè)切割的限制性內(nèi)切酶酶切后,就會產(chǎn)生重復單位數(shù)目不等的片段。這種數(shù)量可變串聯(lián)重復序列(variablenumber of tandemrepeat,VNTR)的片段長度不同,可作為多態(tài)性界標。
短串聯(lián)重復序列(short tandem repeat,STR)是另一類多態(tài)性界標。STR的重復單元長度為2—6個核苷酸。在不同個體的基因組中,這種重復單元的數(shù)目變異很大,因而比RFLPs和VNTR有更高的多態(tài)性;同時,STR在基因組中的豐度很高,基本上是平均分布并便于用PCR檢測,可以大大提高遺傳制圖的精度。
③單核苷酸多態(tài)(single nucleotide polymorphism,SNP)界標 在一個群體中,基因組內(nèi)某一基因座上可以有兩個或兩個以上的等位基因,這是等位基因的多態(tài)性。同樣,在基因組內(nèi)某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因組內(nèi)特定核苷酸位置上存在兩種不同的核苷酸且其出現(xiàn)頻率大于1%(也有人提出為2%)。換言之,如出現(xiàn)頻率低于1%(或2%),則視作點突變。SNP作為單堿基的置換,在群體中只有兩種等位型可以檢出,就形成雙等位標記(biallelic marker),這種界標在人基因組中可多達300萬個,平均每1 300 bp就會有一個。因此,3到4個這種相鄰的界標構(gòu)成的單倍型(haplotype)就可以有8~16種。由于兩個人的基因組作比較時,平均每1 300個核苷酸中有1個差別,所以這種界標數(shù)目極多,覆蓋密度大,由此可以大大提高基因組作圖和基因定位的精度。
SNP作為一種堿基的置換,大多數(shù)是轉(zhuǎn)換,即兩種嘌呤間和兩種嘧啶間的置換。SNP在CG序列上出現(xiàn)最為頻繁,而且多半是C轉(zhuǎn)換成T,因為C常自發(fā)地脫氧后成為T。SNP可以人為地劃分為兩種,一種是遍布在基因組非編碼序列中的單核苷酸變異;另一種則是分布在基因編碼序列中的SNP,稱之為cSNP(coding SNPs)。cSNP或者是“靜默的”、“同義的”不改變編碼產(chǎn)生的蛋白質(zhì);或者是“非同義的”,會改變編碼產(chǎn)生的蛋白質(zhì)的序列,形成了蛋白質(zhì)的多態(tài)性,在功能上有其效應。可是迄今與疾病等直接相關(guān)的SNP是很罕見的。cSNP同點突變之間的差別只在于其在群體出現(xiàn)的頻率,即上面提到的出現(xiàn)頻率大于1%(2%)的歸為多態(tài),低于1%(2%)的則歸人點突變。
④非多態(tài)的短單一序列作為界標 在構(gòu)建基因組物理圖時可以用非多態(tài)的長度為300 bp左右的單一序列作為界標。常用的有標定位置序列(sequence tagged site,STS)和表達序列標簽(expressed sequence tag,EST)。前者是基因組中的單一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。這種界標可以直接標定在基因組上,并便于用PCR進行驗證。EST是代表一種cDNA分子,也就是代表一個基因,但一種cDNA分子或一個基因可以有不止一個EST。由EST構(gòu)成的圖譜,有助于構(gòu)建轉(zhuǎn)錄圖或基因圖。