关于程序员:比较基因组点图介绍与可视化

24次阅读

共计 1189 个字符,预计需要花费 3 分钟才能阅读完成。

动动发财的小手,点个赞吧!

取得基因组后能够进行的次要比拟剖析之一是可视化与密切相关物种的同线性。基因组的许多特色能够通过良好的点图轻松突出显示。能够从这些点图中辨认构造变动,例如倒置、删除、反复和插入。

基因组点图(Genome Dot Plot)是一种用于比拟两个或多个基因组的工具。它通过在一个二维矩阵中绘制基因组序列的相似性来显示基因组之间的绝对关系。点图中的每个点代表一个基因组中的一段序列,而整个图像则反映了序列之间的相似性和差异性。

流程

  1. 序列比对:将要比拟的基因组序列进行比对,以找到类似的区域。
  2. 序列宰割:将比对失去的类似区域切割成较短的片段,通常是几十到几百个碱基对。
  3. 构建点图:将切割失去的片段在二维矩阵中示意。矩阵的行和列代表不同的基因组,而每个片段在矩阵中的地位则反映了其在各个基因组中的呈现地位。
  4. 着色和标记:依据相似性水平,将点图中的片段进行着色和标记。类似的片段通常以雷同的色彩显示,而不类似的片段则以其余色彩显示。

您将须要两个基因组来生成点图。更高质量,最好是在染色体程度上的“参考”基因组(也称为指标基因组)和您的基因组(支架或重叠群都能够,但染色体是现实的),称为查问基因组。

作用

  1. 可视化基因组之间的相似性和差异性:通过点图,能够直观地比拟不同基因组之间的相似性和差异性。类似的片段在点图中会显示为对角线或近似对角线的模式,而不类似的片段则显示为分布在其余地位的点。
  2. 发现基因组重排和反复序列:点图能够帮忙检测基因组重排(基因组外部序列程序的扭转)和反复序列(在同一基因组中呈现屡次的类似片段)。这对于钻研基因组构造和进化过程十分重要。
  3. 寻找基因组中的基因和性能元素:通过比拟不同基因组的点图,能够定位基因和其余性能元素在基因组中的地位。类似的性能元素通常在点图中显示为具备类似模式的片段。
  4. 基因组正文和比拟基因组学钻研:基因组点图是进行基因组正文和比拟基因组学钻研的重要工具之一。它能够帮忙钻研人员了解基因组的构造、性能和演变,并揭示基因组之间的关系。

实战

minimap2 比对

minimap2 -x asm5 -t 36 ref.fa query.fa > result_minimap2.paf

# ref.fa 参考基因组
# query.fa 查问基因组 

可视化

对于点图,咱们将应用 dotPlotly。还有一个 R Shiny 应用程序,但能够绘制的文件大小有限度。而且,如果你上传像玉米对齐这样的简单文件,它会十分迟缓,并且交互能力将无奈应用。因而,咱们将下载脚本并在本地运行它们以生成动态点图。

clone

  • 克隆软件代码
git clone https://github.com/tpoorten/dotPlotly.git

run

  • 运行
./dotPlotly/pafCoordsDotPlotly.R \
   -i result_minimap2.paf \
   -o ctg \
   -s -t -l 

后果

本文由 mdnice 多平台公布

正文完
 0