西瓜基因組解析

2017-03-16    編輯:諾禾致源

245棋牌 西瓜基因組組裝及評估

關于西瓜基因組,早在2012年11月西瓜的基因組就被北京農林科學院、深圳華大基因以及美國康奈爾大學等多家單位合作完成相應的測序及解讀工作。他們選用人工培育的西瓜品種97103,進行全基因組 de novo 測序,采用 Illumina 測序方法測得46.18Gb 的數據(108.6X)。通過 K-mer 評估,預估的基因組大小為 425Mb,組裝的基因組大小為 353.5Mb,基因組覆蓋度達 83.2%。ContigN50 長度為 26.38Kb,ScaffoldN50 長度為 2.38Mb。并將 330Mb 的 Scaffold 定位到了11條染色體上。

245棋牌 接著通過 EST 數據和 BACs 數據對組裝的基因組進行評估,結果顯示組裝的基因組為高質量基因組。同時與其他發表利用二代測序技術拼接的基因組進行比較,同樣說明西瓜基因組組裝質量較高(表1)。

西瓜基因組注釋及進化

對西瓜基因組進行注釋發現,在組裝的353.3Mb的區域有159.8Mb為轉座重復區域,在這些重復區域中有68.3%可以注釋到重復序列家族,此結果也說明在真核生物的基因組中,重復序列占有相當高的比例。同時預測23,440個編碼蛋白的基因,另外還預測了123個rRNA,789個tRNA,335個snRNA以及141個MiRNA。

被子植物中基因組重復非常常見,這種基因組重復也見證了現代植物多種倍型。在西瓜的基因組中我們發現了7個大的triplications,這些區域約占基因組的29%(圖2)。這種三倍化事件可以追溯到76~130百萬年前。為了進一步評估西瓜基因組的進化地位,研究人員通過分析西瓜、黃瓜、甜瓜以及葡萄的基因組,了解它們的系統進化關系,同時進一步分析了葫蘆科家族的染色體進化關系(圖3),染色體共線關系表明葫蘆科植物染色體在進化過程中的復雜性。

評估西瓜基因組的遺傳多樣性

為了評估西瓜基因組的多樣性,研究人員選擇了20個具有代表性的西瓜基因組進行重測序,這20個西瓜包括5個東亞的、5個美洲的、6個半野生型的以及4個野生型的。通過重測序共識別了6,784,860個SNPs和965,006個Indels,這些遺傳多樣性為后續培育新的西瓜品種奠定了基礎。

為了進一步分析驗證不同品種的遠近關系,研究人員對不同品種基因組進行群體結構進化分析(圖3)和主成分分析(圖4),分析結果表明,C. lanatus subsp. vulgaris和 C. lanatus subsp.Mucosospermus 存在較近的親緣關系。

西瓜發育的研究

西瓜的發育是個復雜的過程,這個過程包括體積的改變、顏色改變、紋理的改變、糖分的改變以及營養成分的改變等方面。為了研究發育的過程,研究人員對西瓜發育的4個關鍵時期的瓜皮、瓜肉進行了RNA-seq分析,分別在瓜肉、瓜皮中識別3046和558個異常表達的基因。通過GO分析,這些基因在西瓜發育過程中參與細胞墻的合成、黃酮類代謝等過程,而在瓜肉中,差異基因主要是參與己糖、單糖以及類胡蘿卜素的代謝。

糖分含量是影響西瓜品質的重要因素,在注釋的西瓜基因組上有62個有關糖代謝的酶,76個糖分轉移基因。在西瓜發育中,有13個糖代謝酶和14個糖分轉移酶出現異常表達。說明這些酶在西瓜發育過程中占有重要地位。

參考文獻

245棋牌 Guo S, Zhang J, Sun H, et al. The draft genome of watermelon (Citrullus lanatus) and resequencingof 20 diverse accessions[J]. Nature genetics, 2013, 45(1): 51-58.