向列名添加前缀

在读取以下 帮助文件时,应该可以在列名称中添加前缀:

colnames(x, do.NULL = TRUE, prefix = "col")

下面这些对我没用,我做错了什么?

m2 <- cbind(1,1:4)
colnames(m2, do.NULL = FALSE)
colnames(m2) <- c("x","Y")
colnames(m2) <- colnames(m2, prefix = "Sub_")
colnames(m2)
111525 次浏览

您误读了帮助文件。下面是需要查看的参数:

逻辑。如果 FALSE和名称是 NULL,则创建名称。

请注意该描述中的 还有。您的名字不再是 NULL,所以使用前缀不起作用。

相反,可以这样使用:

> m2 <- cbind(1,1:4)
> colnames(m2) <- c("x","Y")
> colnames(m2) <- paste("Sub", colnames(m2), sep = "_")
> m2
Sub_x Sub_Y
[1,]     1     1
[2,]     1     2
[3,]     1     3
[4,]     1     4

我将为这个问题添加一个 tidyverse方法,您可以为所有列名添加后缀和前缀。下面在 dplyr管道中添加一个前缀。

Dplyr 1.0.2及以后版本

library(dplyr)
df <- data.frame(x = c(1, 2), y = c(3, 4))


## Adding prefixes
df %>% rename_with( ~ paste0("a", .x))


## Adding suffixes
df %>% rename_with( ~ paste0(.x, "a"))

如果希望使用下划线之类的分隔符,也可以将 pastesep参数一起使用。


在 dplyr 1.0.2更新之前

library(dplyr)
df <- data.frame(x = c(1, 2), y = c(3, 4))
df %>% rename_all( ~ paste0("a", .x))

添加后缀更容易。

df %>% rename_all(paste0, "a")

更新后的 tidyverse方法(使用 dplyr 1.0.2)使用 rename_with(),因为 rename_all()函数已被取代。

iris %>% rename_with( ~ paste("Sub", .x, sep = "_"))

stats::setNames函数可以很好地解决这个问题,而且实际上比其他方法快得多。


iris.dt <- data.table::as.data.table(iris)


microbenchmark::microbenchmark(
  

base = colnames(iris) <- paste("Sub", colnames(iris), sep = "_"),
stats = setNames(iris, paste("Sub", colnames(iris), sep = "_")),
dplyr = dplyr::rename_with(iris, ~ paste("Sub", .x, sep = "_")),
datatable = data.table::setnames(iris.dt, paste("Sub", names(iris.dt), sep = "_"))
  

)
#> Unit: microseconds
#>       expr     min       lq       mean   median      uq        max neval cld
#>       base  11.094  16.2140   21.62408  19.2010  23.681     65.707   100   a
#>      stats   8.107  13.8670   17.40435  16.6405  19.841     39.254   100   a
#>      dplyr 786.772 842.8785 5236.67222 877.0130 984.959 402378.407   100   a
#>  datatable  40.961  49.9200   84.06237  62.2935  73.600    834.560   100   a

Reprex 软件包于2020-10-21年度创作(0.3.0版)