Mapping the dynamic genetic regulatory architecture of HLA genes at single-cell resolution
(一)单细胞数据集
- 69个滑膜样本
- 22个肠样本
- 91个PBMC体外培养样本
- OneK1K cohort
(二)Pseudobulk cell type specific eQTL
- 由于作者关注HLA基因,所以只对相关的髓系细胞、T细胞、B细胞进行了分析
- 不同cohrt构建不同的PEERs,根据不同群体大小使用不同数量的PEERs
- 随后单独对每个cohort进行eQTL mapping (P < 4e-9),找出每个HLA基因对应的lead eQTL,其中91.7% (88/96)具备mean directional concord-ance,证明了不同cohort间存在一致性。
- 最终分析得到24个与MHC关联的lead eQTL
Eresid=βGXG+sex+age+βi(1,2,...,5)PCi(1,2,...,5)+βjPEERj+ϵ
- Incorporate all four datasets into a single model (multi-cohort model):
Eresid=βGXG+βdatasetXdataset+ϵ
(三)Determine whether lead eQTLs are cell type dependent
- 为了验证lead eQTL是否为细胞类型特异,又引入了基因型和细胞类型的交叉效应与个体的随机效应进行线性回归
Eresid=βGXG+βcell_typeXcell_type+βG×cell_typeXG×cell_type+(ϕ∣donor)+ϵ
(四)3 rounds conditonal analysis
- 将lead eQTLs作为covar进行再次进行三轮拟合,筛选Secondary eQTLs(P-Value < 5e-8)
(五)HLA genes exhibit cell-state-dependent expression
- 随后使用hPC方法鉴定不同的cell state(类似拟时分析)
(六)Modeling dynamic eQTLs at single-cell resolution
- 非负二项分布混合线性模型
- 利用each gene的UMI counts作为因变量进行回归分析
- 对hPC得到的不同cell state进行单细胞层次的eQTL mapping