关于程序员:R语言中ggplot2绘制热图美化热图流程

50次阅读

共计 3416 个字符,预计需要花费 9 分钟才能阅读完成。

ggplot2 是一款弱小的绘图 R 包,明天的笔记内容是学习应用 ggplot2 来绘制一幅热图,并进行丑化调整。须要加载的包有两个:ggplot2、reshape2

如果你也想跟着笔记一起学习,请拜访链接下载脚本:
https://down.jewin.love/?f=/Rscript/

拜访下面的网址即可下载应用,也能够间接在 Rstudio 中运行上面这一句代码,则会主动在当前工作门路下生成 11 副 PDF 图片后果,稍加批改输出数据就能生成其余的热图。

source("https://down.jewin.love/?f=/Rscript/heatmap.R")

接下来利用示例数据进行简略的流程介绍:

如何绘制一幅热图?

后期筹备与数据创立

首先,须要装置并加载这两个 R 包。

install.packages("ggplot2")
install.packages("reshape2")
library(ggplot2)
library(reshape2)

创立示例数据,并输入数据查看是否失常。

> data <- c(1:6,6:1,6:1,1:6, (6:1)/10,(1:6)/10,(1:6)/10,(6:1)/10,1:6,6:1,6:1,1:6,6:1,1:6,1:6,6:1)
> data #查看以后数据
 [1] 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 6.0 5.0 4.0 3.0 2.0 1.0 1.0 2.0 3.0 4.0
[23] 5.0 6.0 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.1 0.2 0.3 0.4 0.5 0.6 0.6 0.5
[45] 0.4 0.3 0.2 0.1 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 6.0 5.0 4.0 3.0 2.0 1.0
[67] 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 1.0 2.0 3.0 4.0 5.0 6.0 1.0 2.0 3.0 4.0
[89] 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0

将输出的 data 数据转化成数据框格局,并更改列名和行名,查看前五行数据察看是否失常。

> data <- as.data.frame(matrix(data,ncol = 12,byrow = T)) #转化成数据框
> colnames(data) <- c("Zygote","2_cell","4_cell","8_cell","Morula","ICM","ESC","4 week PGC","7 week PGC","10 week PGC","17 week PGC", "OOcyte")
> rownames(data) <- paste("Gene",1:8,sep ="_")
> head(data,5) #输入前五行
       Zygote 2_cell 4_cell 8_cell Morula ICM ESC 4 week PGC 7 week PGC 10 week PGC
Gene_1    1.0    2.0    3.0    4.0    5.0 6.0 6.0        5.0        4.0         3.0
Gene_2    6.0    5.0    4.0    3.0    2.0 1.0 1.0        2.0        3.0         4.0
Gene_3    0.6    0.5    0.4    0.3    0.2 0.1 0.1        0.2        0.3         0.4
Gene_4    0.1    0.2    0.3    0.4    0.5 0.6 0.6        0.5        0.4         0.3
Gene_5    1.0    2.0    3.0    4.0    5.0 6.0 6.0        5.0        4.0         3.0

新建一列命名为 id,内容为每行数据的行名,这样做的目标是为了后续将数据用 melt 函数转化为长类型(每一行的 value 数值变量只有一项,作图所需数据格式),查看数据前 5 行进行察看。

> data$id <- rownames(data) #新建一列(ID),内容为数据的行名
> data_m <- melt(data,id.vars=c("id")) #将原来的数据转化成长数据格式,并以 ID 列为主因素
> head(data_m,5) #查看转换后的后果,该数据将用于后续的流程
      id variable value
1 Gene_1   Zygote   1.0
2 Gene_2   Zygote   6.0
3 Gene_3   Zygote   0.6
4 Gene_4   Zygote   0.1
5 Gene_5   Zygote   1.0

开始绘图

利用 ggplot 函数绘制热图,步骤:先初始化坐标轴 (x=,y=) 而后设置填充类型和填充数据,在绘图函数后用 + 连贯主题批改函数,能够在一直地润饰丑化图片。

p <- ggplot(data_m,aes(x=variable,y=id)) #初始化,读入数据,设置 x 轴和 y 轴
p <- p + geom_tile(aes(fill=value))
#设置填充项为 value 值,绘制热图
p #查看生成的后果 plot,在屏幕右下角处 plot 显示

保留图片

利用 ggsave 函数来保留生成的图片后果,这里演示将 p 保留到当前目录下,命名为my plot 1 .pdf,之后能够在相应目录下找到这张照片,无损矢量图不便批改。

ggsave(p,filename = "my plot 1.pdf",width = 10,
       height = 15,units = "cm",colormodel="srgb") 
#保留以后文件,生成的文件在当前工作目录下保留

刚刚那张图横轴的标签有的重叠到一起了,这样不好。那么如何对生成的热图进行后续调整呢?

丑化热图

tips: 切换显示主题与色彩

theme函数用于设置主题
axis.text.x示意 x 轴标签文本
element_text用来更改文本的角度(angle)、地位(hjust、vjust)
scale_fill_gradient示意用双色梯度形式填充显示。

p <- p + theme(axis.text.x = element_text(angle = 45,hjust = 1,vjust = 1)) #设置标签的显示方式
p <- p + scale_fill_gradient(low="white",high = "red") #设置填充色彩
p #查看后果

切换显示类型与数据展现形式

比方,我想在热图中同时展现两种色彩填充和数值,须要在下面的代码根底上略加修改,增加新的绘图参数。

p <- ggplot(data_m,  #输出文件
  aes(x=variable,y=id)) +  #初始化坐标轴
  xlab("samples") +  #x 轴标签
  theme_bw() + #设置零碎自带主题
  theme(panel.grid.major = element_blank()) +  #设置主项网格
  theme(legend.key=element_blank()) + #去掉背景色彩
  theme(axis.text.x=element_text(angle=45,hjust=1, vjust=1)) +  #设置坐标轴标签
  theme(legend.position="top") +  #设置图例的地位
  geom_tile(aes(fill=value)) +  #设置填充的值
  scale_fill_gradient(low = "white", high = "red") + #设置色彩梯度
  geom_point(aes(color=value), size=6) +  #设置点的色彩和大小
  geom_text(aes(label=value)) #设置文本显示数值
p #输入图片

试一试:从新更换一种主题款式, 将红色填充去掉,并改为蓝色圆点加数值显示。

p <- ggplot(data_m,aes(x=variable,y=id)) +
  xlab("samples") + theme_bw() +
  theme(panel.grid.major = element_blank()) +
  theme(legend.key = element_blank()) +
  theme(axis.text.x = element_text(angle = 45,hjust = 1,vjust = 1)) +
  theme(legend.position="top")+ 
  geom_point(aes(color= value),size=6) +
  scale_color_gradient(low = "white",high = "blue") +
  geom_text(aes(label=value))
p

本节笔记到这里完结,感激你的浏览,如果感觉有用欢送转发分享,今天持续分享绘制热图过程中遇到数据的差别比拟大时解决办法,对原始数据进行转化的技巧和利用。

参考援用:http://www.ehbio.com/Bioinfo_…

本文由 mdnice 多平台公布

正文完
 0