关于程序员:ChIPseq-分析Peak-注释与可视化9

45次阅读

共计 1029 个字符,预计需要花费 3 分钟才能阅读完成。

1. 基因正文

到目前为止,咱们始终在解决对应于转录因子联合的 ChIPseq 峰。顾名思义,转录因子能够影响其靶基因的表白。

转录因子的指标很难独自从 ChIPseq 数据中确定,因而咱们通常会通过一组简略的规定来正文基因的峰:

如果峰与基因重叠,则通常将峰正文为基因。

2. Peak 正文

ChIPseeker 是一个有用的基因峰正文包。通过在小鼠 TXDB 对象(mm10 基因组)的起源中应用预约义的正文,ChIPseeker 将为咱们提供峰落在基因中的地位以及到 TSS 位点的间隔的概览。

首先加载下一部分所需的库。

library(TxDb.Mmusculus.UCSC.mm10.knownGene)
library(org.Mm.eg.db)
library(GenomeInfoDb)
library(ChIPseeker)

annotatePeak 函数承受要正文的区域的 GRanges 对象、基因地位的 TXDB 对象和要从中检索基因名称的数据库对象名称。

peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
    annoDb = "org.Mm.eg.db")

class(peakAnno)

后果是一个蕴含峰正文和整体正文统计信息的 csAnno 对象。

peakAnno

csAnno 对象蕴含无关基因的单个峰的正文信息。要从 csAnno 对象中提取它,ChIPseeker 函数 as.GRanges 或 as.data.frame 可用于生成具备峰及其相干基因的相应对象。

peakAnno_GR <- as.GRanges(peakAnno)
peakAnno_DF <- as.data.frame(peakAnno)
peakAnno_GR[1:2,]

3. 可视化 Peak 正文

当初咱们有了来自 ChIPseeker 的正文峰,咱们能够应用 ChIPseeker 的一些绘图性能来显示基因特色中峰的散布。在这里,咱们应用 plotAnnoBar 函数将其绘制为条形图,但 plotAnnoPie 会生成相似于饼图的图。

plotAnnoBar(peakAnno)

同样,咱们能够绘制 TSS 站点四周峰值的散布。

plotDistToTSS(peakAnno)

ChIPseeker 还能够提供一个简洁的图来形容正文之间的重叠。

upsetplot(peakAnno, vennpie = F)

本文由 mdnice 多平台公布

正文完
 0