这次需要绘制的如下所示的多层饼状图:

python ggplot画饼形图 ggplot2饼图_Group

总的来说就是对你的数据的分类要求更严格一些,分为大类及大类下面的小类,其实这样的数据可以靠Excel画出来,不过我还是想用R来实现。

最开始的时候,按照[【R语言】多层饼图][https://www.jianshu.com/p/7410c023df7b]这个教程的方法去画图,可是在绘制的时候发现了一些问题。

如果使用他构建的数据集,去绘制双层饼状图确实没有什么问题,但是,当我在我自己的数据上去绘制的时候,就遇到了一些问题,我的数据如下所示:

python ggplot画饼形图 ggplot2饼图_开发语言_02

也就是我的大类和小类如果按照R内部默认的字符串顺序去排列的话,那么顺序就会与我指定的不一致,这里就引出了第一个问题,在计算text位置时的差异。在原来的教程中,他是使用字母对大小类进行排序的,如下:

dat = data.frame(x = rep('b',7),
  y = rep('a',7),
  z = rep('c',7),
  cat1 = paste('c',1:7, sep = '_'),
  cat2 = c('a1','a1','a2','a2','a3','a4','a4'),
  value1 = 1:7,
  value2 = 1:7)

然后对其大小类进行百分比的就算:

# 分别求所占百分比
 dat1 = aggregate(dat$value1, by = list(dat$cat1), FUN = sum)
 dat1$per1 = dat1$x / sum(dat1$x)
 
 # for循环构建标签的相对位置
 for (i in seq(nrow(dat1), 1)) {
  if (i == nrow(dat1)) {
  dat1$per.y1[i] = dat1$per1[i] / 2
  }else{
  dat1$per.y1[i] = sum(dat1$per1[(i + 1):nrow(dat1)]) + dat1$per1[i] / 2
  }
 }
 
 # 构建标签后合并数据
 dat1$label1 = paste(dat1$Group.1,'(',round(dat1$per1*100, 2),'%',')', sep = '')
 dat = merge(dat, dat1[,c(1,3,4,5)], by.x = 'cat1', by.y = 'Group.1')
 
 # 重复操作
 dat2 = aggregate(dat$value2, by = list(dat$cat2), FUN = sum)
 dat2$per2 = dat2$x / sum(dat2$x)
 
 for (i in seq(nrow(dat2), 1)) {
  if (i == nrow(dat2)) {
  dat2$per.y2[i] = dat2$per2[i] / 2
  }else{
  dat2$per.y2[i] = sum(dat2$per2[(i + 1):nrow(dat2)]) + dat2$per2[i] / 2
  }
 }
 
 dat2$label2 = paste(dat2$Group.1,'(',round(dat2$per2*100, 2),'%',')', sep = '')
 dat = merge(dat, dat2[,c(1,3,4,5)], by.x = 'cat2', by.y = 'Group.1')

其实这里有一步是多余的,就是求百分比,在这里求百分比主要是为了后面可以输出label,但是这步并不是必须的,而且从最后一行往上算也没有必要,增加了代码量,可以直接用cumSum代替。

这些都是小问题,按照这个流程走,我最主要的问题就是后面会发现色块与标签根本对不上!!!

# 绘图
 ggplot(dat) +
  # 绘制柱状图
  geom_bar(aes(y, 
  ifelse(cat2 == 'a3', per2, per2/2),  ## 这一步我也不知道为啥
  fill = cat2),
  stat = 'identity', width = 1.3) +
  # 添加标签
  geom_text(aes(1.25, as.numeric(per.y2), 
  label = label2),
  size =2.5, color = 'black') +
  # 绘制柱状图
  geom_bar(aes(x, per1, fill = cat1), 
  stat = 'identity', width = .8, color = 'white') +
  # 添加标签
  geom_text(aes(2, as.numeric(per.y1),label = label1),
  size = 2.5, color = 'black') +
  # 设置Y轴刻度
  scale_y_continuous(labels = scales::percent) +
  coord_polar(theta = "y") + # 转换坐标轴
  theme_void() +
  scale_fill_igv() + # 设置填充色
  theme(legend.position = 'none') # 隐藏图例

因为我设置fill映射并不是像a1,a2,a3...这种默认顺序与指定顺序一致的字符串,而是"Trichophyton", "Microsporon", "Epidermophyton",..这样不符合默认排序规则的字符串顺序,所以在后面绘图的时候,如果不将我的fill指定因子顺序,我就会得到一对不符合我先前计算的text位置的色块堆积图。。。,这里只需要优化一下fill的映射。

fill = fct_reorder(cat2,per.y2,.desc=TRUE)

搞定,就像之前说的,这个代码可以简化一下,不用一开始就计算比例,也不要把两个表合在一起,改进如下所示:

dat$BigType <- factor(dat$BigType,levels = unique(dat$BigType)) ## 必须先指定因子,否则在group_by的时候又会不是指定顺序,导致后面出图出不了。

dat1 <- dat %>%
  select(BigType,Num) %>% group_by(BigType) %>% 
  summarise(total = sum(Num)) %>%
  ungroup() %>% 
  mutate(perc = total/sum(total),
         y = cumsum(total) - 0.5*total,
         label = paste0(BigType,"(",paste0(round(perc,3),"%"),")"))

dat2 <- dat %>%
  select(ToType,Num) %>%
  mutate(perc = Num/sum(Num),
         y = cumsum(Num) - 0.5*Num,
         label = paste0(ToType,"(",paste0(round(perc,3),"%"),")"))

ggplot()+
  geom_bar(data = dat2,aes(x=2,y=Num,fill=fct_reorder(ToType,y,.desc = TRUE)),stat="identity",width = 1,color="white")+ ## 指定width是为了防止留下白色色间隔
  geom_text_repel(data =dat2,size=2.5,direction = "x",point.padding = 0,box.padding = 0,nudge_x = .3,aes(x=2,y=as.numeric(y),label=label))+
  geom_bar(data = dat1,aes(x=1,y=total,fill=fct_reorder(BigType,y,.desc = TRUE)),stat="identity",width = 1,color="white")+
  geom_text_repel(data =dat1,size=2.5,direction = "x",point.padding = 0,box.padding = 0,nudge_x = .3,aes(x=1,y=as.numeric(y),label=label))+
  coord_polar(theta = "y")+
  scale_y_continuous(labels = scales::percent) +
  theme_void()+ ## 隐藏所有背景,边框,坐标轴
  scale_fill_igv() + # 设置填充色
  theme(legend.position = 'none',
        text = element_text(family = 'Arial',size = 5)) # 隐藏图例

python ggplot画饼形图 ggplot2饼图_开发语言_03

参考资料

【R语言】多层饼图:https://www.jianshu.com/p/7410c023df7b