连接一个字符串/字符的向量

如果我有一个类型字符的向量,我怎么能连接到字符串的值?下面是我如何用粘贴()来做到这一点:

sdata = c('a', 'b', 'c')
paste(sdata[1], sdata[2], sdata[3], sep ='')

产生"abc"

但当然,这只有在我提前知道sdata的长度时才有效。

378439 次浏览

尝试在paste函数中使用空崩溃参数:

paste(sdata, collapse = '')

感谢http://twitter.com/onelinetips/status/7491806343

马特的答案绝对是正确的。然而,为了减轻喜剧效果,这里有一个替代方案:

do.call(paste, c(as.list(sdata), sep = ""))

sdata:

gsub(", ", "", toString(sdata))

对于整数向量:

gsub(", ", "", toString(c(1:10)))

马特·特纳的答案绝对是正确的。然而,在Ken Williams回答的精神中,你也可以这样做:

capture.output(cat(sdata, sep=""))

你可以像这样使用stri_paste函数和stringi包中的collapse参数:

stri_paste(letters, collapse='')
## [1] "abcdefghijklmnopqrstuvwxyz"

还有一些基准:

require(microbenchmark)
test <- stri_rand_lipsum(100)
microbenchmark(stri_paste(test, collapse=''), paste(test,collapse=''), do.call(paste, c(as.list(test), sep="")))
Unit: microseconds
expr     min       lq     mean   median       uq     max neval
stri_paste(test, collapse = "") 137.477 139.6040 155.8157 148.5810 163.5375 226.171   100
paste(test, collapse = "") 404.139 406.4100 446.0270 432.3250 442.9825 723.793   100
do.call(paste, c(as.list(test), sep = "")) 216.937 226.0265 251.6779 237.3945 264.8935 405.989   100

下面是一个小实用函数,它将一个命名或未命名的值列表折叠为一个字符串,以便于打印。它还将打印代码行本身。它来自我的用R列出例子页面。

生成一些命名或未命名的列表:

# Define Lists
ls_num <- list(1,2,3)
ls_str <- list('1','2','3')
ls_num_str <- list(1,2,'3')


# Named Lists
ar_st_names <- c('e1','e2','e3')
ls_num_str_named <- ls_num_str
names(ls_num_str_named) <- ar_st_names


# Add Element to Named List
ls_num_str_named$e4 <- 'this is added'

下面是将命名或未命名列表转换为字符串的a函数:

ffi_lst2str <- function(ls_list, st_desc, bl_print=TRUE) {


# string desc
if(missing(st_desc)){
st_desc <- deparse(substitute(ls_list))
}


# create string
st_string_from_list = paste0(paste0(st_desc, ':'),
paste(names(ls_list), ls_list, sep="=", collapse=";" ))


if (bl_print){
print(st_string_from_list)
}
}

使用之前创建的列表测试函数:

> ffi_lst2str(ls_num)
[1] "ls_num:=1;=2;=3"
> ffi_lst2str(ls_str)
[1] "ls_str:=1;=2;=3"
> ffi_lst2str(ls_num_str)
[1] "ls_num_str:=1;=2;=3"
> ffi_lst2str(ls_num_str_named)
[1] "ls_num_str_named:e1=1;e2=2;e3=3;e4=this is added"

用列表元素的子集测试函数:

> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"
> ffi_lst2str(ls_num[2:3])
[1] "ls_num[2:3]:=2;=3"
> ffi_lst2str(ls_str[2:3])
[1] "ls_str[2:3]:=2;=3"
> ffi_lst2str(ls_num_str[2:4])
[1] "ls_num_str[2:4]:=2;=3;=NULL"
> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"

另一种方法是使用glue包:

glue_collapse(glue("{sdata}"))
paste(glue("{sdata}"), collapse = '')

stringr库有一些快速的方法可以实现这一点。

str_flatten

默认情况下将不带空格地折叠你的字符向量,但也有collapse参数:

str_flatten(sdata)
[1] "abc"

str_c

类似于paste,你需要指定一个collapse参数来实现这一点:

str_c(sdata, collapse = "")
[1] "abc"

基地:paste0

虽然与paste相比没有明显的优势,但你可以从底数R使用paste0(sdata, collapse = "")


在我的机器上更新一个更长的字符串向量的基准测试结果如下:

set.seed(4)
x <- sample(letters, 1E6, replace = T)
microbenchmark(stri_paste(x, collapse=''),
paste(x,collapse=''),
do.call(paste, c(as.list(x), sep="")),
stringr::str_flatten(x),
stringr::str_c(x, collapse = ""),
paste0(x, collapse = ""))


Unit: milliseconds
expr      min        lq       mean     median        uq       max neval cld
stri_paste(x, collapse = "")  21.1788  21.80040   23.45225   22.78430   24.4271   39.1305   100 a
paste(x, collapse = "") 110.7734 114.36595  126.43277  119.02755  136.5902  187.4112   100  b
do.call(paste, c(as.list(x), sep = "")) 538.8329 981.80345 1090.51738 1096.33470 1213.8848 1457.5622   100   c
stringr::str_flatten(x)  20.6276  21.60610   23.36241   22.73915   24.2210   42.3481   100 a
stringr::str_c(x, collapse = "")  20.9274  21.74285   23.75466   22.73950   24.3254   36.6114   100 a
paste0(x, collapse = "") 110.0614 112.81175  124.15555  116.96610  130.6330  168.7199   100  b

同样本着肯·威廉姆斯回答的精神:

Reduce(paste0, sdata)
[1] "abc"