中草藥基因組匯編

2017-01-12    編輯:諾禾致源
甘草(The Plant Journal)

豆科植物甘草屬,重要的藥用植物,是一種補益中草藥。藥用部位是根及根莖,具有改善肝功能、抗炎癥、治療胃痛、腹痛等多種功效。同時,甘草也是醫藥、化妝品的重要原料。

利用二加三代組裝,基因組大小為379Mb,Scaffold N50=109Kb,共預測到34445個基因。與其它豆科植物的基因組信息及全基因組進行分析比較,發現合成異黃酮物質相關基因(CYP93C、HI40MT、7-IOMT)群的一部分形成基因簇,研究小組進一步對生物合成相關的含有酶基因的基因家族深入分析,發現了其遺傳結構和遺傳表達規律。



大麻(Genome biology)

245棋牌 桑科、大麻屬植物。目前大麻及其衍生物如大麻藥是世界上消費最普遍的非法藥物,一直作為一系列疾病如多發性硬化和慢性疼痛病癥等的治療藥物而被廣泛關注。此外,產纖維大麻也成為許多國家的重要農作物。

利用二代測序數據組裝,基因組大小為820Mb,雜合率約為0.2%,共確定40224個蛋白編碼基因,Scaffold N50=16.2kb。本研究發現花的基因表達模式和大麻素及萜類的合成是一致的,編碼大麻素途徑酶的基因,以及編碼參與前體途徑蛋白的基因都在花發育的三個階段(花前期、花早期和發育中期)高度表達。對藥用大麻與纖維大麻的大麻素途徑基因比較發現,藥用大麻的整個合成途徑基因表達量高。AAE3基因發生擴增,推測其參與大麻素的生物合成。



鐵皮石斛(Molecular Plant )

蘭科植物,其莖部含有抗氧化和抗腫瘤活性化合物,并能夠緩解胃部不適,促進體液分泌的傳統藥物。因其藥用價值幾乎被開發殆盡,在中國被列為珍惜瀕危藥用植物之一。

245棋牌 利利用二加三代測序組裝,基因組大小Contig N50=25.1Kb,Scaffold N50=76.4Kb。重復序列為63.33%,雜合率達到0.48%。共確定35,567個蛋白編碼基因,確定了1,462個鐵皮石斛特有的基因家族,與植物發育光控制、抗病抗逆、木質部及纖維素合成有關。研究分析了鐵皮石斛一些藥用成分的生物合成信號通路,發現與多糖生成相關的蔗糖磷酸合成酶(SPS)和蔗糖合成酶(SuSy)基因發生了大規模復制,分別鑒定出10個SPS和15個SuSy基因。此外,生物堿也是鐵皮石斛的一種重要生物成分,研究還進一步探究了生物堿的合成通路及相關蛋白。



蛹蟲草(Genome Biology)

蟲草屬的模式種,又稱冬蟲夏草,世界性分布。由子座(草部分)與菌核(昆蟲尸體)組成,其蟲草酸具有藥用價值,可以治療病后虛弱、咳血等癥,是一種能同時平衡、調節陰陽的中藥。

利用二代測序組裝,基因組大小為32.2Mb,Scaffold N50=4.6Mb,確定了9684個蛋白編碼基因。本研究中對蛹蟲草和綠僵菌的基因組進行比對分析。分析結果表明蛹蟲草的出現比綠僵菌早約1.3億年,各自獨立進化且具有殺蟲特性,表現出協同進化的特點。蛋白酶和幾丁質酶等用于昆蟲體壁降解的蛋白家族表現出明顯的擴張現象。基因組分析表明,蛹蟲草基因組大約有16%的編碼基因參與真菌—昆蟲的相互作用,不存在編碼對于人類有害的已知真菌毒素。研究首次表明,蛹蟲草為有性生殖類型。此外,與其他真菌不同,其子實體發育主要受MAPK信號途徑調控,而非MAPK和PKA共同調控。



丹參(GigaScience、Molecular Plant)

唇形科植物,傳統的中草藥,全國大部分地區都有分布,生于向陽山坡草叢、林邊等地,起初主要用于治療心腦血管疾病,具有活血祛瘀、清心除煩、涼血消癰等功效。2015年,采用二加三代混合組裝,基因組大小為641 Mb,Contig N50=82.8Kb,Scaffold N50=1.2Mb。預測出34,598個蛋白質編碼基因以及1,644個丹參基因組中特異的基因。

245棋牌 來自于L-苯丙氨酸的迷迭香酸是丹參中重要的藥用成分。本研究用擬南芥中類黃酮合成通路中相關基因作為參照,挖掘丹參中苯丙素合成關鍵基因,發現在丹參根中表達最高。2016年采用二加三代混合組裝方法獲得丹參基因組草圖。基因組大小538 Mb,Contig N50 = 12.38 Kb,Scafflod N50 = 51.02 Kb。最終預測得到了30,478個蛋白質編碼基因,系統進化樹分析丹參與芝麻親緣關系最近,兩者分化與67百萬年前。并對丹參進行了基因家族進化和功能分析。TPSs和CYPs基因簇通常與萜類化合物合成中的持續酶活有關。本研究進一步證實了這些基因簇與丹參酮生物合成的關系。系統進化分析表明SmCPS1和SmCPS2簇來源于CPS/CYP76AH的復制事件。結合轉錄組數據,分析了丹參酮合成相關基因各個組織部位的表達差異。本研究還比較了藥用價值較高的開白色花的丹參基因組與開紫色花的丹參基因組間的遺傳差異。



參考文獻

245棋牌 [1] Draft genome assembly and annotation of Glycyrrhiza uralensis, a medicinal legume.The Plant Journal. 2016

245棋牌 [2] Genome sequence of the insect pathogenic fungus Cordyceps militaris, a valued traditional chinese medicine. Genome Biology.2011

245棋牌 [3] Genome sequencing of herb Tulsi (Ocimum tenuiflorum) unravels key genes behind its strong medicinal properties. Plant Biology. 2015

[4] The draft genome and transcriptome of Cannabis sativa. Genome biology. 2011

羅勒(Plant Biology)

唇形科植物,為藥食兩用芳香植物。羅勒植株有活血、解毒等功效。在東南亞國家廣泛種植,能夠提取精油,有多種功效。

二代測序組裝,基因組大小為374.8Mb,Contig N50=2.6Kb,Caffold N50=27.1Kb,基因組注釋確定36768個基因。在其他5種已測序品種發現89922個同源基因。并確定了16個在其他22個物種中無同源或同源關系的特有基因。通過比對羅勒和其他植物基因組,挖掘合成具有藥用價值的次生代謝物質基因。在羅勒植物中有近30種次生代謝物質。在羅勒基因組中共確定458個與合成次生代謝物相關基因,并結合轉錄組數據挖掘出與重要次生代謝相關基因的表達模式。



靈芝(Nature Communications)

245棋牌 靈芝是多孔菌科真菌靈芝的子實體,是傳統中國醫藥的標志,是世界最知名的藥用大型真菌,具有抗癌、抗高血壓、抗病毒和免疫調節活性等功效,靈芝能產生大量的生物活性化合物,其中超過400種已被確定,使靈芝擁有生物活性化合物的細胞“工廠”之稱。

組裝獲得靈芝基因組大小為43.3Mb,Contig N50=649.7kb,Scaffold N50=1.4Mb。共確定16,113個蛋白編碼基因,基因組序列結合轉錄組分析,對靈芝不同發育階段基因的表達情況進行了探究;基因組比較分析三萜類生物合成相關基因,發現大量編碼CYPs和LSS的相關基因及其共表達情況,并確定了大量含有CYP基因的基因簇,其中兩個與LSS共表達。
靈芝擁有一個龐大而完整的木質素過氧化物酶系列,以及漆酶和纖維二糖脫氫酶,這些酶的存在說明靈芝會通過不同的方法分解木質素。



瑪卡(BioRxiv)

245棋牌 十字花科植物,適宜在高海拔地區生長。是一種純天然食物,營養成分豐富。瑪卡富含高單位營養素,對人體有滋補強身的功能。主要含兩類新的植物活性成分,瑪卡酰胺和瑪卡稀,這兩種物質對平衡人體荷爾蒙分泌有顯著作用,所以瑪卡又被稱為天然荷爾蒙發動機。

用二代組裝獲得基因組大小為743Mb,Contig N50=81Kb,Scaffold N50=2.4Mb。基因組注釋獲得51,339個蛋白編碼基因和34,846個非蛋白編碼基因,通過比較基因組學分析,瑪卡中有9,713個基因家族擴張,主要包括參與非生物脅迫相應、激素信號傳導和次生代謝物質合成相關基因。在6.7 Mya年前瑪卡發生過全基因組復制事件,使得瑪卡適應高海拔的極端環境。
245棋牌 全基因組復制事件使得參加葉片發育的基因RCO、KNOX和CUC增加,葉片邊緣表現出鋸齒狀,表面積減少。參與抗寒和抗UV-B的基因增加。瑪卡基因組中與春化作用相關基因丟失,使得瑪卡不存在明顯的春化現象。