这次需要绘制的如下所示的多层饼状图:
总的来说就是对你的数据的分类要求更严格一些,分为大类及大类下面的小类,其实这样的数据可以靠Excel画出来,不过我还是想用R来实现。
最开始的时候,按照[【R语言】多层饼图][https://www.jianshu.com/p/7410c023df7b]这个教程的方法去画图,可是在绘制的时候发现了一些问题。
如果使用他构建的数据集,去绘制双层饼状图确实没有什么问题,但是,当我在我自己的数据上去绘制的时候,就遇到了一些问题,我的数据如下所示:
也就是我的大类和小类如果按照R内部默认的字符串顺序去排列的话,那么顺序就会与我指定的不一致,这里就引出了第一个问题,在计算text位置时的差异。在原来的教程中,他是使用字母对大小类进行排序的,如下:
dat = data.frame(x = rep('b',7),
y = rep('a',7),
z = rep('c',7),
cat1 = paste('c',1:7, sep = '_'),
cat2 = c('a1','a1','a2','a2','a3','a4','a4'),
value1 = 1:7,
value2 = 1:7)
然后对其大小类进行百分比的就算:
# 分别求所占百分比
dat1 = aggregate(dat$value1, by = list(dat$cat1), FUN = sum)
dat1$per1 = dat1$x / sum(dat1$x)
# for循环构建标签的相对位置
for (i in seq(nrow(dat1), 1)) {
if (i == nrow(dat1)) {
dat1$per.y1[i] = dat1$per1[i] / 2
}else{
dat1$per.y1[i] = sum(dat1$per1[(i + 1):nrow(dat1)]) + dat1$per1[i] / 2
}
}
# 构建标签后合并数据
dat1$label1 = paste(dat1$Group.1,'(',round(dat1$per1*100, 2),'%',')', sep = '')
dat = merge(dat, dat1[,c(1,3,4,5)], by.x = 'cat1', by.y = 'Group.1')
# 重复操作
dat2 = aggregate(dat$value2, by = list(dat$cat2), FUN = sum)
dat2$per2 = dat2$x / sum(dat2$x)
for (i in seq(nrow(dat2), 1)) {
if (i == nrow(dat2)) {
dat2$per.y2[i] = dat2$per2[i] / 2
}else{
dat2$per.y2[i] = sum(dat2$per2[(i + 1):nrow(dat2)]) + dat2$per2[i] / 2
}
}
dat2$label2 = paste(dat2$Group.1,'(',round(dat2$per2*100, 2),'%',')', sep = '')
dat = merge(dat, dat2[,c(1,3,4,5)], by.x = 'cat2', by.y = 'Group.1')
其实这里有一步是多余的,就是求百分比,在这里求百分比主要是为了后面可以输出label,但是这步并不是必须的,而且从最后一行往上算也没有必要,增加了代码量,可以直接用cumSum代替。
这些都是小问题,按照这个流程走,我最主要的问题就是后面会发现色块与标签根本对不上!!!
# 绘图
ggplot(dat) +
# 绘制柱状图
geom_bar(aes(y,
ifelse(cat2 == 'a3', per2, per2/2), ## 这一步我也不知道为啥
fill = cat2),
stat = 'identity', width = 1.3) +
# 添加标签
geom_text(aes(1.25, as.numeric(per.y2),
label = label2),
size =2.5, color = 'black') +
# 绘制柱状图
geom_bar(aes(x, per1, fill = cat1),
stat = 'identity', width = .8, color = 'white') +
# 添加标签
geom_text(aes(2, as.numeric(per.y1),label = label1),
size = 2.5, color = 'black') +
# 设置Y轴刻度
scale_y_continuous(labels = scales::percent) +
coord_polar(theta = "y") + # 转换坐标轴
theme_void() +
scale_fill_igv() + # 设置填充色
theme(legend.position = 'none') # 隐藏图例
因为我设置fill
映射并不是像a1,a2,a3...
这种默认顺序与指定顺序一致的字符串,而是"Trichophyton", "Microsporon", "Epidermophyton",..
这样不符合默认排序规则的字符串顺序,所以在后面绘图的时候,如果不将我的fill
指定因子顺序,我就会得到一对不符合我先前计算的text位置的色块堆积图。。。,这里只需要优化一下fill
的映射。
fill = fct_reorder(cat2,per.y2,.desc=TRUE)
搞定,就像之前说的,这个代码可以简化一下,不用一开始就计算比例,也不要把两个表合在一起,改进如下所示:
dat$BigType <- factor(dat$BigType,levels = unique(dat$BigType)) ## 必须先指定因子,否则在group_by的时候又会不是指定顺序,导致后面出图出不了。
dat1 <- dat %>%
select(BigType,Num) %>% group_by(BigType) %>%
summarise(total = sum(Num)) %>%
ungroup() %>%
mutate(perc = total/sum(total),
y = cumsum(total) - 0.5*total,
label = paste0(BigType,"(",paste0(round(perc,3),"%"),")"))
dat2 <- dat %>%
select(ToType,Num) %>%
mutate(perc = Num/sum(Num),
y = cumsum(Num) - 0.5*Num,
label = paste0(ToType,"(",paste0(round(perc,3),"%"),")"))
ggplot()+
geom_bar(data = dat2,aes(x=2,y=Num,fill=fct_reorder(ToType,y,.desc = TRUE)),stat="identity",width = 1,color="white")+ ## 指定width是为了防止留下白色色间隔
geom_text_repel(data =dat2,size=2.5,direction = "x",point.padding = 0,box.padding = 0,nudge_x = .3,aes(x=2,y=as.numeric(y),label=label))+
geom_bar(data = dat1,aes(x=1,y=total,fill=fct_reorder(BigType,y,.desc = TRUE)),stat="identity",width = 1,color="white")+
geom_text_repel(data =dat1,size=2.5,direction = "x",point.padding = 0,box.padding = 0,nudge_x = .3,aes(x=1,y=as.numeric(y),label=label))+
coord_polar(theta = "y")+
scale_y_continuous(labels = scales::percent) +
theme_void()+ ## 隐藏所有背景,边框,坐标轴
scale_fill_igv() + # 设置填充色
theme(legend.position = 'none',
text = element_text(family = 'Arial',size = 5)) # 隐藏图例
参考资料
【R语言】多层饼图:https://www.jianshu.com/p/7410c023df7b