跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_简书 image.png

论文对应的代码是公开的 https://github.com/ajwilk/2020_Wilk_COVID

跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_数据分析_02 image.png


今天重复的内容是论文中的 补充材料Fig4中的小a中的第三个小图


跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_数据分析_03 image.png

数据准备好是如下格式


跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_简书_04 image.png


需要示例数据可以直接在文末留言


第一步读入数据
mydf<-read.csv("Single_Cell/covid_metadata_c.csv",header=T,row.names = 1)
dim(mydf)
mydf

这里作图用到的是​​ggscatter()​​​函数,这个函数来自​​ggpubr​​这个包。

最基本的散点图
library(ggpubr)
ggscatter(mydf,x="DPS",y="ISG")

这里需要注意的是想x,y后面跟着的值需要加双引号


跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_r语言_05 image.png

添加拟合曲线
p1<-ggscatter(mydf,x="DPS",y="ISG",
add = "reg.line")
添加置信区间
p2<-ggscatter(mydf,x="DPS",y="ISG",
add = "reg.line",
conf.int = T)
更改坐标轴标签
p3<-ggscatter(mydf,x="DPS",y="ISG",
add = "reg.line",
conf.int = T)+
labs(y = "Mean ISG module score",
x = "Days post-symptom onset")
添加相关系数和p值
p4<-ggscatter(mydf,x="DPS",y="ISG",
add = "reg.line",
conf.int = T)+
labs(y = "Mean ISG module score",
x = "Days post-symptom onset")+
stat_cor(label.x = 8, label.y = 0.2)
最后是拼图
ggarrange(p1,p2,p3,p4,
ncol = 2,
nrow = 2,
labels = c("p1","p2","p3","p4"))

最终的结果如下

跟着Nature Methods学画图:R语言ggplot2散点图并添加拟合曲线和置信区间_数据分析_06 image.png

欢迎大家关注我的公众号

小明的数据分析笔记本


小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!