如何重命名data.frame中的单列?

小开

试一试:

colnames(x)[2] <- 'newname2'

小开

最佳答案

colnames(trSamp)[2] <- "newname2"

尝试设置第二列的名称。对象只有一列，因此该命令会抛出错误。这就足够了:

colnames(trSamp) <- "newname2"

小开

如果你知道你的数据帧只有一列，你可以使用: names(trSamp) <- "newname2"

小开

你也可以尝试'Hmisc'包中的'upData'。

library(Hmisc)

trSamp = upData(trSamp, rename=c(sample.trainer.index..10000. = 'newname2'))

小开

这是一种通用的方法，你不需要记住变量的确切位置:

# df = dataframe
# old.var.name = The name you don't like anymore
# new.var.name = The name you want to get


names(df)[names(df) == 'old.var.name'] <- 'new.var.name'

这段代码基本上完成了以下工作:

names(df)查找df中的所有名称
[names(df) == old.var.name]提取你想检查的变量名
<- 'new.var.name'分配新的变量名。

小开

这也可以使用Hadley的plyr包和rename函数来完成。

library(plyr)
df <- data.frame(foo=rnorm(1000))
df <- rename(df,c('foo'='samples'))

您可以根据名称重命名(不知道位置)，并一次执行多个重命名。例如，在进行合并之后，你可能会得到:

  letterid id.x id.y
1       70    2    1
2      116    6    5
3      116    6    4
4      116    6    3
5      766   14    9
6      766   14   13

然后你可以在一个步骤重命名使用:

letters <- rename(letters,c("id.x" = "source", "id.y" = "target"))


letterid source target
1       70      2      1
2      116      6      5
3      116      6      4
4      116      6      3
5      766     14      9
6      766     14     13

小开

这是一个老问题，但值得注意的是，你现在可以从data.table包中使用setnames。

library(data.table)


setnames(DF, "oldName", "newName")


# or since the data.frame in question is just one column:
setnames(DF, "newName")


# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)

小开

我喜欢下一个样式来逐个重命名dataframe列名。

colnames(df)[which(colnames(df) == 'old_colname')] <- 'new_colname'

在哪里

which(colnames(df) == 'old_colname')

由指定列的索引返回。

小开

colnames(df)[colnames(df) == 'oldName'] <- 'newName'

小开

这可能已经存在了，但我在寻找解决方案时尝试了重命名字段，并心血来潮地尝试了这一点。为我的目的工作。

Table1$FieldNewName <- Table1$FieldOldName
Table1$FieldOldName <- NULL

编辑从这里开始....

这也同样有效。

df <- rename(df, c("oldColName" = "newColName"))

小开

你可以在gdata包中使用rename.vars。

library(gdata)
df <- rename.vars(df, from = "oldname", to = "newname")

当你有多个变量名要修改，或者你想在变量名后面追加或预先添加一些文本时，这是特别有用的，你可以这样做:

df <- rename.vars(df, from = c("old1", "old2", "old3",
to = c("new1", "new2", "new3"))

有关将文本附加到变量名称子集的示例，请参见: https://stackoverflow.com/a/28870000/180892

小开

我认为重命名列的最好方法是像这样使用dplyr包:

require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)

对于重命名任何数据集中的一个或多个列，它的工作原理相同。

小开

我发现重命名单列最方便的方法是使用dplyr::rename_at:

library(dplyr)
cars %>% rename_at("speed",~"new") %>% head
cars %>% rename_at(vars(speed),~"new") %>% head
cars %>% rename_at(1,~"new") %>% head


#   new dist
# 1   4    2
# 2   4   10
# 3   7    4
# 4   7   22
# 5   8   16
# 6   9   10

适用于管道链
当名称存储在变量中时很方便
与名称或列索引一起使用
清晰紧凑

小开

我只需用我想要的名称向数据帧添加一个新列，并从现有列中获取它的数据。是这样的:

dataf$value=dataf$Article1Order

然后我删除旧的列!是这样的:

dataf$Article1Order<-NULL

这段代码可能看起来很傻!但它工作得很完美……

小开

OP的问题已经得到了很好的回答。然而，这里有一个在某些情况下可能有用的技巧:部分匹配列名，不管它在数据框架中的位置:

名称部分匹配:

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("Reported", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

另一个例子:标点符号出现时的部分匹配:

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("[[:punct:]]", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

这些都是我今天要处理的例子，我认为可能值得分享。

小开

我将简单地用以下代码将列名更改为我想要的新名称的数据集: Names (dataset)[index_value] <- "new_col_name" .

小开

library(dplyr)
rename(data, de=de.y)

小开

我发现colnames()参数更容易 https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/row%2Bcolnames

从数据帧中选择某一列

df <- data.frame(df[, c( "hhid","b1005", "b1012_imp", "b3004a")])

并按顺序重命名所选列，

colnames(df) <- c("hhid", "income", "cost", "credit")

检查名称和值以确定

names(df);head(df)

小开

我们可以使用rename_with函数来重命名列(例如stringr函数)。

考虑以下数据df_1:

df_1 <- data.frame(
x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)),
y = sample(x = 1:2, size = 10, replace = TRUE)
)


names(df_1)


#[1] "x.1" "x.2" "x.3" "y"

用dplyr::everything()重命名所有的变量:

library(tidyverse)


df_1 %>%
rename_with(.data = ., .cols = everything(.),
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()


#[1] "var_1" "var_2" "var_3" "var_4"

用一些dplyr动词(starts_with， ends_with， contains， matches，…)重新命名为名字粒子。

.的例子(x变量):

df_1 %>%
rename_with(.data = ., .cols = contains('.'),
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()


#[1] "var_1" "var_2" "var_3" "y"

通过类重命名类测试的许多函数，如is.integer， is.numeric， is.factor…

is.integer (y)的示例:

df_1 %>%
rename_with(.data = ., .cols = is.integer,
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()


#[1] "x.1"   "x.2"   "x.3"   "var_1"

警告:

警告消息: 1:在stri_replace_first_regex(string, pattern, fix_replacement(replacement)中，: 较长的对象长度不是较短的对象长度的倍数 2: In names[cols] <- .fn(names[cols]，…) 要替换的项数不是替换长度的倍数

这是不相关的，因为它只是seq_along(.)与replace函数的不一致。

小开

让df是你有col名称myDays和temp的数据框架。如果你想重命名“myday "“;Date"

library(plyr)
rename(df,c("myDays" = "Date"))

或者用管子，你可以

dfNew      <- df %>%
plyr::rename(c("myDays" = "Date"))