人類疾病基因組測序數據分析之Burden analysis

2017-03-16    編輯:諾禾致源
Burden analysis定義

中文可翻譯為負荷檢驗,對于復雜疾病研究的傳統的關聯分析都是基于位點的case-control法,尋找疾病組和正常對照組之間存在顯著性頻率差異的位點。而Burden analysis作為一種統計算法,則是將位于某一基因(或是和某一代謝途徑相關的基因組區域,或是任意指定的某一基因組區域)內的變異位點放在一起考慮,將其作為一個整體,與性狀進行關聯分析。

Burden analysis的應用

之前基于芯片的GWAS研究是基于常見疾病—常見變異(common disease common variants)假說,現在基于二代測序的關聯分析研究重點關注常見疾病—稀有變異(common disease rare variants);因為稀有變異的頻率低(小于1%),需要使用基于基因的Burden analysis來增加統計功效。此外,常見疾病致病基因異質性問題遠遠超出了我們的想象,為了在有限范圍內捕捉到目標基因,基于代謝通路或基因組區段的Burden analysis更有助于復雜疾病的研究。

Burden analysis的優勢

245棋牌本次升級亮點即為增加基于基因的Burden analysis,利用Fisher's exact test和SKAT統計方法。結果展示如下:

1. 整合P-value的excel(表1)
2. Heatmap圖展示(圖1)
245棋牌3. 通過以上分析得到的候選基因可以進行如下分析

a 富集分析,包括KEGG富集分析和GO富集分析(圖2)
b 蛋白網絡互作(PPI)(圖3)

參考文獻

[1] Ware J S,Li J, Mazaika E, et al. Shared Genetic Predisposition in Peripartum and Dilated Cardiomyopathies[J]. New England Journal of Medicine, 2016, 374(3): 233-241.
[2] Cirulli E T, Lasseigne B N, Petrovski S, et al. Exome sequencing in amyotrophic lateralsclerosis identifies risk genes and pathways[J]. Science, 2015, 347(6229):1436-1441.
[3] Akinrinade O, Ollila L, Vattulainen S, et al. Genetics and genotype–phenotype correlations in Finnish patients with dilated cardiomyopathy[J]. European heart journal,2015, 36(34): 2327-2337.
[4] Do R, Stitziel N O, Won H H, et al. Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction[J]. Nature, 2015,518(7537): 102-106.
[5] Tang H, Jin X, Li Y, et al. A large-scale screen for coding variants predisposing topsoriasis[J]. Nature genetics, 2014, 46(1): 45-50.