关于后端:snpEFF和bedtools基因注释有何异同

3次阅读

共计 954 个字符,预计需要花费 3 分钟才能阅读完成。

大家好,我是邓飞,当初写博客越来越繁琐了,每个平台对图片都有本人的规定,不能通用,各种找不到图片,本着充值是我变强的准则,买了 Markdown Nice 的 VIP(https://product.mdnice.com/),据说实现了一键公布多个平台,而且有本人的图库,明天先水一篇,试试成果。

星球上有老师问:snpEFF 和 bedtools 都能够正文基因,他们有什么区别?

当我无奈立刻答复时,我都会说:“这是一个好问题”,而后就开始找答案或者总结答案,过后我的答复:

bedtools 是针对多数的位点,snpEff 是针对 vcf 的数据。bedtools 个别是针对显著性的 snp,去查找候选基因。snpEff 是下机的 vcf,定位 snp 是属于哪个地位,不会有上下游的设置

下面的答复根本解释了两者的差别,然而,因为要水一篇,所以要解释一下写篇博客!

1. bedtools 和 snpEFF 软件介绍

这两款软件,官网上具体介绍都有:

bedtools:
https://bedtools.readthedocs.io/en/latest/index.html

snpEFF:
http://pcingola.github.io/SnpEff/

简短的来说,bedtools 能够解决基因型数据,各种简单的性能,匹配、删减、格局转换等,称为生信界的瑞士军刀。

snpEFF 如同专一于基因正文。

2. 区别 1:数据格式不一样

vcftools 须要 gff 文件和 bed 数据,才能够进行正文。

snpEFF,输出文件是 vcf 格局,另外,他须要基因组数据和 gff 创立数据库(通用的物种官网有现成的,然而举荐自定义构建,不容易出错。

3. 区别 2:是否指定上下游区间

snpEFF 不能指定上下游区间,准确的给出位点在基因组上的区域(内含子、外显子、哪个基因等等)

bedtools,能够指定上下游区间,对于 GWAS 剖析失去的显著性位点,因为存在 LD,所以更灵便,利用更多。

4. 区别 3:应用领域

snpEFF,次要是下机数据,vcf 数据,运算速度快,给出每个 SNP 的信息

bedtools,次要是须要设置上下游区间的位点,比方 GWAS 失去的显著性位点。

下面就是两者的区别,bedtools 正文基因的写过好几篇博客了,下一篇介绍 snpEFF 正文 vcf 的教程。

本文由 mdnice 多平台公布

正文完
 0