R语言中DataFrame列名作为函数参数

在使用Tidyverse提供的各种函数时,我们很多时候都会直接传递DataFrame的列名作为函数参数,对对应的列进行操作。如果我们自定义的函数中需要传递列名作为函数参数,如何实现呢?

直接传递列名会怎么样?

比如,我们自定义一个函数,用于计算指定列名的平均值

# 函数定义
col_mean <- function(data, colname) { data %>% summarise(across(colname, mean)) }
# 函数调用,这里的mpg为数据表中的列名
data <- read_csv(readr_example('mtcars.csv'))
col_mean(data, mpg)

执行结果:

R语言中DataFrame列名作为函数参数_函数参数


可以发现,直接使用列名传递到函数中会报错,下面介绍两种解决方案:

使用{{}}语法糖

col_mean <- function(data, colname) { data %>% summarise(across({{colname}}, mean)) }

在函数体中使用{{}}将列名括起来即可。

使用enquo函数和!!语法糖

col_mean <- function(data, colname) { colname <- enquo(colname); data %>% summarise(across(!!colname, mean)) }

第二种方法是在函数体内部,先使用​​enquo()​​函数将列名转为表达式,然后在使用的时候通过!!符号进行提取即可。

R语言中DataFrame列名作为函数参数_函数参数_02