MAGMA
简介
MAGMA is a tool for gene analysis and generalized gene-set analysis of GWAS data. It can be used to analyse both raw genotype data as well as summary SNP p-values from a previous GWAS or meta-analysis.
原理
待施工
安装
官网提供了如下版本
即开即用
使用
示例数据
- GWAS数据:BMI meta analysis的一套数据,样本量为339224
- 基因坐标:Gene locations, build 37
- 1KG:European
- 通路文件:msigdb.v7.4
01 Annotation
需要提供对下载得到的GWAS summary statistics进行预处理,得到snp.loc
文件,\t
分割,分别为rsID chrosome postion
,不需要列名:
1 | cat gwas.tsv | \ |
执行注释
1 | ./magma_v1.10_mac/magma --annotate \ |
得到.genes.annot
文件储存了单个基因范围之内的SNP,其中第一列为基因的index,与.gene.loc
一致,第二、三列为基因的坐标范围,其后为则为该范围内的SNP
02 Gene analysis
有两种模式,一种基于raw GWAS data,另一种基于SNP p-value,这里使用后者。
首先需要对GWAS summary statistics中的-log值进行转换:
1 | cat gwas.tsv | \ |
执行关联分析
1 | ./magma_v1.10_mac/magma --bfile ./g1000_eur/g1000_eur \ |
bfile
可以使用原始数据或者是LD参考面板。
输出的.out
储存了关联分析结果,也就是基因与表型的相关性:
输出的.raw
文件作为下一步的输入。
03 Gene-set analysis
这一步对显著的基因是否富集于某个基因集或通路进行检验,得到通路与表型的相关性。这里对经典通路进行检验,在GSEA上下载通路文件.gmt
:
1 | ./magma_v1.10_mac/magma --gene-results 02_gene_analysis.genes.raw \ |
输出.gsa.out
文件,储存了如下信息: