MAGMA

1.5k 词

MAGMA

简介

MAGMA is a tool for gene analysis and generalized gene-set analysis of GWAS data. It can be used to analyse both raw genotype data as well as summary SNP p-values from a previous GWAS or meta-analysis.

原理

待施工

安装

官网提供了如下版本

即开即用

使用

示例数据

  1. GWAS数据:BMI meta analysis的一套数据,样本量为339224
  2. 基因坐标:Gene locations, build 37
  3. 1KG:European
  4. 通路文件:msigdb.v7.4

01 Annotation

需要提供对下载得到的GWAS summary statistics进行预处理,得到snp.loc文件,\t分割,分别为rsID chrosome postion,不需要列名:

1
2
3
cat gwas.tsv | \ 
awk -F'\t' '$3 != "."' | \
awk -F'\t' '{ print $3"\t"$1"\t"$2}' > snp.loc

执行注释

1
2
3
4
./magma_v1.10_mac/magma --annotate \ 
--snp-loc snp.loc \
--gene-loc ./NCBI37.3/NCBI37.3.gene.loc \
--out 01_annotation_step

得到.genes.annot文件储存了单个基因范围之内的SNP,其中第一列为基因的index,与.gene.loc一致,第二、三列为基因的坐标范围,其后为则为该范围内的SNP

02 Gene analysis

有两种模式,一种基于raw GWAS data,另一种基于SNP p-value,这里使用后者。
首先需要对GWAS summary statistics中的-log值进行转换:

1
2
3
cat gwas.tsv | \ 
awk -F'\t' '$3 != "."' | \
awk -F'\t' '{print $3"\t"exp(-$6)}' > pvalue.tsv

执行关联分析

1
2
3
4
./magma_v1.10_mac/magma --bfile ./g1000_eur/g1000_eur \ 
--pval pvalue.tsv N=339224 \
--gene-annot 01_annotation_step.genes.annot \
--out 02_gene_analysis

bfile可以使用原始数据或者是LD参考面板。
输出的.out储存了关联分析结果,也就是基因与表型的相关性:

输出的.raw文件作为下一步的输入。

03 Gene-set analysis

这一步对显著的基因是否富集于某个基因集或通路进行检验,得到通路与表型的相关性。这里对经典通路进行检验,在GSEA上下载通路文件.gmt

1
2
3
./magma_v1.10_mac/magma --gene-results 02_gene_analysis.genes.raw \ 
--set-annot msigdb.v7.4.entrez.gmt \
--out 03_gene_set_analysis

输出.gsa.out文件,储存了如下信息:

参考

  1. https://ctg.cncr.nl/software/magma#
  2. https://gwaslab.org/2021/12/13/magma/