关于程序员:ChIPseq-分析数据质控实操5

39次阅读

共计 2079 个字符,预计需要花费 6 分钟才能阅读完成。

1. 数据

明天将持续回顾咱们在上一次中钻研的 Myc ChIPseq。这包含用于 MEL 和 Ch12 细胞系的 Myc ChIPseq 及其输出对照。

  • 可在此处找到 MEL 细胞系中 Myc ChIPseq 的信息和文件
  • 可在此处找到 Ch12 细胞系中 Myc ChIPseq 的信息和文件
  • 能够在此处找到 MEL 细胞系的输出管制
  • 可在此处找到 Ch12 细胞系的输出对照。

2. 品质管制

ChIPseq 有许多潜在噪声源,包含 抗体的不同效率 非特异性联合 文库复杂性 ChIP 伪影和背景。

许多这些噪声源都能够应用一些欠缺的办法进行评估。

2.1. 质控参考

  • Encode 质量指标。

Large-scale quality analysis of published ChIPseq data. Marinov GK, Kundaje A, Park PJ, Wold BJ. G3 (Bethesda). 2014 Feb 19;4(2)

  • ChIPseq 中人工制品反复的高估。

Systematic evaluation of factors influencing ChIPseq fidelity.Nat Methods. Chen Y, Negre N, Li Q, Mieczkowska JO, Slattery M, Liu T, Zhang Y, Kim TK, He HH, Zieba J, Ruan Y, Bickel PJ, Myers RM, Wold BJ, White KP, Lieb JD, Liu XS. 2012 Jun;9(6)

  • 什么时候 QC 有用。

Impact of artifact removal on ChIP quality metrics in ChIPseq and ChIP-exo data.Front Genet. 2014 Apr 10;5:75.Carroll TS, Liang Z, Salama R, Stark R, de Santiago I

2.2. 适合的输出

  • 在 IP 富集之前,输出样本通常由片段化的 DNA 制成。
  • 容许管制样本中呈现的伪影区域。
  • 切勿在不思考应用哪个输出的状况下运行 ChIPseq。

例如:当应用肿瘤样本进行 ChIPseq 时,匹配输出样本很重要。同一组织的不同条件可能共享独特的输出。

2.3. 质量指标

ChIPQC 包将一些指标包装到 Bioconductor 包中,并留神在适当的条件下测量这些指标。

要运行单个样本,咱们能够应用 ChIPQCsample() 函数、相干的未过滤 BAM 文件,咱们倡议提供黑名单作为 BED 文件或 GRanges 和基因组名称。

您能够在 Anshul Kundaje 的网站或间接从 Encode 网站找到大多数基因组的黑名单

QCresult <- ChIPQCsample(reads = "/pathTo/myChIPreads.bam", genome = "mm10", blacklist = "/pathTo/mm10_Blacklist.bed")

咱们从 Encode 下载 mm10 的黑名单。而后,咱们能够应用 ChIPQC 包中的 ChIPQCsample() 函数对咱们的 ChIPseq 样本品质进行初步剖析。

在这里,咱们评估咱们在之前的会话中应用 Rsubread 对齐的样本的品质。返回的对象是 ChIPQCsample 对象。

library(ChIPQC)
toBlkList <- "~/Downloads/ENCFF547MET.bed.gz"
chipqc_MycMel_rep1 <- ChIPQCsample("SR_Myc_Mel_rep1.bam", annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
class(chipqc_MycMel_rep1)

咱们能够显示咱们的 ChIPQCsample 对象,它将显示咱们的 ChIPseq 品质的根本摘要。

chipqc_MycMel_rep1

2.4. 多样本 QC

最好对照您的输出对照和咱们正在应用的其余 Myc 样本(如果您没有本人的数据,甚至是内部数据)查看 ChIPseq 品质。

这将使咱们可能辨认样本与对照中 ChIPseq 富集的预期模式,并通过这些指标发现任何异样样本。

咱们能够应用 lapply 对所有感兴趣的样本运行 ChIPQCsample()。

bamsToQC <- c("Sorted_Myc_Ch12_1.bam", "Sorted_Myc_Ch12_2.bam", "Sorted_Myc_MEL_1.bam",
    "Sorted_Myc_MEL_2.bam", "Sorted_Input_MEL.bam", "Sorted_Input_Ch12.bam")
myQC <- bplapply(bamsToQC, ChIPQCsample, annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
names(myQC) <- bamsToQC

所有 ChIPQC 函数都能够与 ChIPQCsample 对象的命名列表一起应用,以将分数聚合到表和图中。

在这里,咱们应用 QCmetrics() 函数来概述质量指标。

QCmetrics(myQC)

本文由 mdnice 多平台公布

正文完
 0