论文

Evolutionary origins of the SARS-CoV-2 sarbecovirus lineage responsible for the COVID-19 pandemic

跟着Nature microbiology学画图:R语言pheatmap包画热图展示密码子RSCU值_公众号 image.png

本地文件 ​​s41564-020-0771-4.pdf​

代码和数据下载链接

​https://github.com/plemey/SARSCoV2origins​

今天的推文我们来重复一下论文中的 Figure5 a

跟着Nature microbiology学画图:R语言pheatmap包画热图展示密码子RSCU值_公众号_02 image.png

加载R包

library(pheatmap)
library(tidyverse)
library(viridis)

读取数据

all_rscu <- read_csv('all_rscu_codonBiasReanalysis.csv')

选取数据集的2到26列

all_df <- as.data.frame(all_rscu[,2:26])

给数据集赋予行名

row.names(all_df) <- all_rscu$codon

画热图

pheatmap(all_df,
cluster_rows = F,
scale = 'none',
fontsize_row = 5,
fontsize_col = 10,
color = magma(50),
border_color = NA,
cutree_cols = 4
)

跟着Nature microbiology学画图:R语言pheatmap包画热图展示密码子RSCU值_数据分析_03 image.png


论文中提供的代码到这里就结束了,但这个结果和论文最终使用的图还是有很大的区别的。


  • x轴的字体如果是拉丁名会调整为斜体,这个如何调整可以参考视频
  • x轴还添加了表示分组的线段和文字,这个如何用代码实现暂时还搞不定了,想到办法再来介绍

  • 图例由左侧改到了底部,并且改成了水平,而且添加了文字标题。暂时不知道用代码来如何实现了


大家如果知道对应的解决办法欢迎留言!


欢迎大家关注我的公众号

小明的数据分析笔记本


小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!