PacBio單分子實時技術解析結核分枝桿菌復合群甲基化組

2017-01-17    編輯:諾禾致源

研究背景

結核病感染主要由結核分枝桿菌復合群(Mycobacterium tuberculosis complex, MTBC)引起,
MTBC成員菌株在基因組序列上相似性超過99%,但是不同的譜系在毒力和宿主(人、動物等)上有著較大的差異。
本文利用PacBio三代單分子實時測序技術,對12株MTBC菌的全基因甲基化組進行了全方位的解析。
通過深入挖掘,探知到了“單位點”甚至“單read”的甲基化情況。
借助甲基化圖譜首次揭示了在細菌中也存在大量的“部分甲基化”及“未甲基化”位點,
說明細菌的甲基化也可能如真核甲基化一樣具有復雜的調控機制。
文章為深入探究基因組表觀遺傳修飾的精準調控機制提供了新的工具和思路,也為結核病原菌的發病機理提供了新的視角。

材料與方法

樣品來源:245棋牌12株結核分枝桿菌(Mycobacterium bovis;M. bovis BCG;M. microti;M. africanum;M. tuberculosis H37Rv;H37Ra;和6 個M. tuberculosis臨床分離株)

DNA提取試劑盒:TIANamp Bacteria Genomic DNA Kit (Tiangen Biotech Co. Ltd., Beijing, China)

測序平臺:Pacific Biosciences RSII

測序策略:245棋牌10KB SMRT bell文庫,測序深度100X

整體研究思路:

研究結果

245棋牌 1.基因組信息

245棋牌 首先得到了基因組信息,12株菌的GC%含量在65%左右,基因組大小4.34~4.43Mb,預測的基因數目4000~5000,這些基因均勻的分布在基因組的正義鏈和反義鏈上(表1)。

表1 12個MTBC菌株整體基因組信息



245棋牌 3.甲基化基序種類

測序的結果表明,甲基化類型為m6A,另外還有大量不確定的修飾類型,通過實驗證實,基本上都是假陽性。一共檢測到3種甲基化基序,除了先前已經被證實的CTCCAG(T表示互補鏈上的A),還包括CACGCAG和GATN4RTAC,這12個MTBC菌株中有著不同的甲基化基序種類,而這很可能是各自對應的甲基化酶失活引起的(表2)。

表2 12個MTBC菌株基因組甲基化比較



5.未甲基化motif的形成機制

通過質粒構建,證實GATN4RTAC基序位點識別和甲基化的基因是HsdM,CACGCAG是MamB(圖3)。

圖3 12個MTBC菌株三種甲基化酶基因及其對應的甲基化序列基序


為了探究這些未甲基化motif的形成機制,作者統計了其中最為頻繁的未甲基化位點,在GATN4RTAC和CTCCAG基序中,前10的未甲基化位點至少存在于兩個菌株中,而且有三種在所有測試菌株中均存在(表4)。


245棋牌 表4 12個MTBC菌株中包含未甲基化位點前10的基因

245棋牌 2.SNP位點分析

對MTBC菌株基因組SNP位點分析,構建系統發育樹,結果顯示,主要分成了8大支系,發現在6個臨床菌株中,兩株屬于L2(北京型),三株屬于L4(歐美型),還有一株屬于L3(東非印度型)(圖1)。

圖1 結核分枝桿菌復合群系統發育分析



4.啟動子區域研究

三種基序在基因組上隨機分布,和其他兩種基序相比,GATN4RTAC更加偏好在基因間區(IGRs),大約占到了12~13%,而且在起始密碼子上游70~80bp有富集,該區段是啟動子所在區域,因此很可能參與了啟動子活性的調節(圖2)。

圖2 12個MTBC菌株基因組信息和DNA甲基化組圓環圖

245棋牌 GATN4RTAC和CTCCAG總是存在一些未甲基化的位點,這些位點大部分兩條鏈都未甲基化,但也有一條鏈未甲基化的。在7個MTBC菌株中,高達23%的GATN4RTAC未甲基化位點位于基因間區,通過基因組比較,這些位點位于起始密碼子上游50bp以內,而大多數啟動子位于上游70~80bp。這些位點很可能總是處于未甲基化的狀態,從而使相關基因能夠正常轉錄(表3)。


245棋牌 表3 12個MTBC菌株未甲基化位點

研究結論

一共鑒定到了3種m6A甲基化基序及相對應的甲基轉移酶基因——mamA、hsdM 和mamB,并且驗證了hsdM 和mamB甲基化酶的基序和功
能。同時發現,這3種酶的活性在不同種系中存在差異,通過比較基因組學的研究,發現很可能是基因突變或缺失降低了甲基化酶活性。借助
245棋牌 于對單位點甲基化比例的計算,得到了MTBC的精準甲基化圖譜,從而能夠更加深入地研究甲基化酶。