R语言多图组合共用图例 r语言图例

转载

IT剑客之家 2024-06-07 10:11:57

文章标签 R语言多图组合共用图例 r语言数据挖掘数据图例 文章分类 R语言后端开发

Australian Salaries by Gender

欢迎来到ggplot2的世界！

ggplot2是一个用来绘制统计图形的 R 软件包。它可以绘制出很多精美的图形，同时能避免诸多的繁琐细节，例如添加图例等。

用 ggplot2 绘制图形时，图形的每个部分可以依次进行构建，之后还可以进行编辑。ggplot2 精心挑选了一系列的预设图形，因此在大部分情形下可以快速地绘制出许多高质量的图形。如果在格式上还有额外的需求，也可以利用 ggplot2 中的主题系统来进行定制, 无需花费太多时间来调整图形的外观，而可以更加转注地用图形来展现你的数据。

R语言多图组合共用图例 r语言图例_r语言

1. 一些环境设置

# 设置为国内镜像, 方便快速安装模块
options("repos" = c(CRAN = "https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

2. 设置工作路径

wkdir <- '/home/user/R_workdir/TidyTuesday/2018/2018-04-23_Australian_Salaries_by_Gender/src-c'
setwd(wkdir)

3. 加载 R 包

library(tidyverse)

# 导入字体设置包
library(showtext) 
# font_add_google() showtext 中从谷歌字体下载并导入字体的函数
# name 中的是字体名称, 用于检索, 必须严格对应想要字体的名字 
# family 后面的是代码后面引用时的名称, 自己随便起
# 需要能访问 Google, 也可以注释掉下面这行, 影响不大
# font_families_google() 列出所有支持的字体, 支持的汉字不多
# http://www.googlefonts.net/
font_add_google(name = "Merienda", family =  "Merienda")
font_add_google(name = "Gochi Hand", family =  "gchi")
font_add_google(name = "ZCOOL XiaoWei", family =  "zxw")

# 后面字体均可以使用导入的字体
showtext_auto()

4. 加载数据

df_input <- read.csv("../data/week4_australian_salary.csv", header = TRUE, sep = ',', row.names = 1)

# 简要查看数据内容
glimpse(df_input)

## Rows: 2,197
## Columns: 5
## $ gender_rank            <int> 795, 881, 699, 828, 641, 760, 200, 136, 157, 99…
## $ occupation             <chr> "Abattoir process worker; Meat process worker; …
## $ gender                 <chr> "Female", "Male", "Female", "Male", "Female", "…
## $ individuals            <int> 5961, 17241, 1386, 636, 1878, 903, 78380, 77112…
## $ average_taxable_income <int> 36359, 40954, 40926, 44077, 43545, 47833, 71552…

# 检查数据的列名
colnames(df_input)

## [1] "gender_rank"            "occupation"             "gender"                
## [4] "individuals"            "average_taxable_income"

5. 数据预处理

# 按性别选择前10名的职业
top.10 <- df_input %>% 
  # select() 选择需要使用的列
  select(occupation, gender, average_taxable_income, individuals) %>% 
  # group_by() 以指定的列进行分组
  group_by(gender) %>% 
  # top_n() 表示选择前多少个观测
  top_n(n = 10, wt = individuals) %>% 
  # arrange() 根据 change 列进行排序, 默认是升序; arrange + desc() 表示改为降序排列
  arrange(desc(individuals))

# 将职业的名称简化一下一下, sub() 字符串替换
top.10$job <- sub(';.*$', '', top.10$occupation)

# 文件中有些字符不兼容, 防止报错, 我们也提前替换掉, stringr::str_replace() 也可以用于字符串替换
top.10$job <- stringr::str_replace(top.10$job, "<96>", "")

# 简要查看数据内容
glimpse(top.10)

## Rows: 20
## Columns: 5
## Groups: gender [2]
## $ occupation             <chr> "Administration assistant; Office worker", "Bot…
## $ gender                 <chr> "Female", "Female", "Female", "Male", "Male", "…
## $ average_taxable_income <int> 43604, 27979, 52565, 62350, 54081, 122695, 3728…
## $ individuals            <int> 293738, 191711, 153207, 143209, 139939, 136047,…
## $ job                    <chr> "Administration assistant", "Bottle shop attend…

6. 利用 ggplot2 绘图

# PS: 方便讲解, 我这里进行了拆解, 具体使用时可以组合在一起
gg <- ggplot(top.10, aes(job, individuals, color = gender, size = average_taxable_income))
# geom_point() 绘制散点图, 上面一步将性别映射给了颜色, 平均收入映射给了大小
gg <- gg + geom_point()
# coord_flip() 横纵坐标位置转换
gg <- gg + coord_flip()
# guides() 设置图例信息
gg <- gg + guides(size = guide_legend("薪资水平（澳元）"), color = guide_legend("性别"))
# labs() 对图形添加注释和标签（包含标题 title、子标题 subtitle、坐标轴 x & y 和引用 caption 等注释)
gg <- gg + labs(title = "2013-2014年平均应税收入（澳元）中的性别工资差距",
                subtitle = "在澳大利亚薪酬最高的工作中，女性收入低于男性（横坐标为人数, 纵坐标为职业）",
                x = NULL,
                y = NULL,
                caption = "资料来源: data.gov.au · graph by 数绘小站 · 2022-10-23")
# theme_minimal() 去坐标轴边框的最小化主题
gg <- gg + theme_minimal()
# theme() 实现对非数据元素的调整, 对结果进行进一步渲染, 使之更加美观
gg <- gg + theme(
  # plot.margin 调整图像边距, 上-右-下-左
  plot.margin = margin(12, 20, 2, 0), 
  # panel.grid.major 主网格线, 这一步表示删除主要网格线
  panel.grid.major = element_blank(),
  # panel.grid.minor 次网格线, 这一步表示删除次要网格线
  panel.grid.minor = element_blank(),
  # panel.background 面板背景 数据下面
  panel.background = element_rect(fill = '#FFFFE0', color = '#FFFFE0', size = 0),
  # plot.background 图片背景 
  plot.background = element_rect(fill = '#FFFFE0', color = '#FFFFE0', size = 0),
  # axis.text.x X-坐标轴文本
  axis.text.x = element_text(color = "black", size = 12, family =  "gchi", face = "bold"),
  # axis.text.y Y-坐标轴文本
  axis.text.y = element_text(color = "black", size = 10, family =  "Merienda", face = "bold"),
  # plot.title 主标题
  plot.title = element_text(color = "black", size = 18, family = "zxw", face = "bold", hjust = -1.0),
  # plot.subtitle 次要标题
  plot.subtitle = element_text(color = "red", size = 10, vjust = -1.2),
  # plot.caption 说明文字
  plot.caption =  element_text(hjust = 0.85, vjust = 30.2),
  # legend.position 设置图例位置, 这里指定图例摆放的绝对位置
  legend.position = c(.8, 0.56))

7. 保存图片到 PDF 和 PNG

gg

R语言多图组合共用图例 r语言图例_R语言多图组合共用图例_02

filename = '20180423-C-01'
ggsave(filename = paste0(filename, ".pdf"), width = 9.2, height = 6.0, device = cairo_pdf)
ggsave(filename = paste0(filename, ".png"), width = 9.2, height = 6.0, dpi = 100, device = "png", bg = '#FFFFE0')

8. session-info

sessionInfo()

## R version 4.2.1 (2022-06-23)
## Platform: x86_64-pc-linux-gnu (64-bit)
## Running under: Ubuntu 20.04.5 LTS
## 
## Matrix products: default
## BLAS:   /usr/lib/x86_64-linux-gnu/openblas-pthread/libblas.so.3
## LAPACK: /usr/lib/x86_64-linux-gnu/openblas-pthread/liblapack.so.3
## 
## locale:
##  [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
##  [3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
##  [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
##  [7] LC_PAPER=en_US.UTF-8       LC_NAME=C                 
##  [9] LC_ADDRESS=C               LC_TELEPHONE=C            
## [11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] showtext_0.9-5  showtextdb_3.0  sysfonts_0.8.8  forcats_0.5.2  
##  [5] stringr_1.4.1   dplyr_1.0.10    purrr_0.3.4     readr_2.1.2    
##  [9] tidyr_1.2.1     tibble_3.1.8    ggplot2_3.3.6   tidyverse_1.3.2
## 
## loaded via a namespace (and not attached):
##  [1] lubridate_1.8.0     assertthat_0.2.1    digest_0.6.30      
##  [4] utf8_1.2.2          R6_2.5.1            cellranger_1.1.0   
##  [7] backports_1.4.1     reprex_2.0.2        evaluate_0.16      
## [10] highr_0.9           httr_1.4.4          pillar_1.8.1       
## [13] rlang_1.0.6         curl_4.3.3          googlesheets4_1.0.1
## [16] readxl_1.4.1        rstudioapi_0.14     jquerylib_0.1.4    
## [19] rmarkdown_2.16      textshaping_0.3.6   labeling_0.4.2     
## [22] googledrive_2.0.0   munsell_0.5.0       broom_1.0.1        
## [25] compiler_4.2.1      modelr_0.1.9        xfun_0.32          
## [28] systemfonts_1.0.4   pkgconfig_2.0.3     htmltools_0.5.3    
## [31] tidyselect_1.1.2    fansi_1.0.3         crayon_1.5.2       
## [34] tzdb_0.3.0          dbplyr_2.2.1        withr_2.5.0        
## [37] grid_4.2.1          jsonlite_1.8.2      gtable_0.3.1       
## [40] lifecycle_1.0.3     DBI_1.1.3           magrittr_2.0.3     
## [43] scales_1.2.1        cli_3.4.1           stringi_1.7.8      
## [46] cachem_1.0.6        farver_2.1.1        fs_1.5.2           
## [49] xml2_1.3.3          bslib_0.4.0         ragg_1.2.3         
## [52] ellipsis_0.3.2      generics_0.1.3      vctrs_0.4.2        
## [55] tools_4.2.1         glue_1.6.2          hms_1.1.2          
## [58] fastmap_1.1.0       yaml_2.3.5          colorspace_2.0-3   
## [61] gargle_1.2.1        rvest_1.0.3         knitr_1.40         
## [64] haven_2.5.1         sass_0.4.2

测试数据

配套数据下载：week4_australian_salary.csv

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 字符串找第二个和第三个 python3 字符串查找

下一篇：目标检测网络正负样本比重目标检测网络结构

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

R语言多图组合共用图例 r语言 图例

R语言多图组合共用图例 r语言 图例

Australian Salaries by Gender

1. 一些环境设置

2. 设置工作路径

3. 加载 R 包

4. 加载数据

5. 数据预处理

6. 利用 ggplot2 绘图

7. 保存图片到 PDF 和 PNG

8. session-info

测试数据

51CTO博客

R语言多图组合共用图例 r语言图例

R语言多图组合共用图例 r语言图例