在字符串中的特定位置插入字符

小开

最佳答案

可以使用正则表达式和 gsub来实现这一点。

gsub('^([a-z]{3})([a-z]+)$', '\\1d\\2', old)
# [1] "abcdefg"

如果您想动态地执行此操作，可以使用 paste创建表达式:

letter <- 'd'
lhs <- paste0('^([a-z]{', n-1, '})([a-z]+)$')
rhs <- paste0('\\1', letter, '\\2')
gsub(lhs, rhs, old)
# [1] "abcdefg"

根据 DWin 的评论，您可能希望这个更一般。

gsub('^(.{3})(.*)$', '\\1d\\2', old)

这样，任何三个字符都将匹配，而不仅仅是小写。DWin 还建议使用 sub而不是 gsub。这样您就不必担心 ^了，因为 sub只与第一个实例匹配。但是我喜欢在正则表达式中表达清楚，只在理解正则表达式时才转向更一般的表达式，并且发现需要更一般的表达式。

正如 Greg Snow 指出的，您可以使用另一种形式的正则表达式来查看匹配的后面:

sub( '(?<=.{3})', 'd', old, perl=TRUE )

也可以使用 sprintf而不是 paste0构建我的动态 gsub:

lhs <- sprintf('^([a-z]{%d})([a-z]+)$', n-1)

或者他的 sub正则表达式:

lhs <- sprintf('(?<=.{%d})',n-1)

小开

@ Justin 的回答是我实际上会采用这种方式，因为它的灵活性，但这个也可以是一种有趣的方式。

您可以将字符串视为“固定宽度格式”，并指定要插入字符的位置:

paste(read.fwf(textConnection(old),
c(4, nchar(old)), as.is = TRUE),
collapse = "d")

特别好的是使用 sapply时的输出，因为您可以看到原始字符串作为“ name”。

newold <- c("some", "random", "words", "strung", "together")
sapply(newold, function(x) paste(read.fwf(textConnection(x),
c(4, nchar(x)), as.is = TRUE),
collapse = "-WEE-"))
#            some          random           words          strung        together
#   "some-WEE-NA"   "rand-WEE-om"    "word-WEE-s"   "stru-WEE-ng" "toge-WEE-ther"

小开

你最初的方法(即在索引处分割字符串并粘贴到插入的文本中)可以变成一个通用函数，如下所示:

split_str_by_index <- function(target, index) {
index <- sort(index)
substr(rep(target, length(index) + 1),
start = c(1, index),
stop = c(index -1, nchar(target)))
}


#Taken from https://stat.ethz.ch/pipermail/r-help/2006-March/101023.html
interleave <- function(v1,v2)
{
ord1 <- 2*(1:length(v1))-1
ord2 <- 2*(1:length(v2))
c(v1,v2)[order(c(ord1,ord2))]
}


insert_str <- function(target, insert, index) {
insert <- insert[order(index)]
index <- sort(index)
paste(interleave(split_str_by_index(target, index), insert), collapse="")
}

示例用法:

> insert_str("1234567890", c("a", "b", "c"), c(5, 9, 3))
[1] "12c34a5678b90"

这允许您在索引向量给定的位置插入字符向量。split_str_by_index和 interleave函数本身也很有用。

编辑:

我修改了代码，以允许索引按任意顺序排列。

小开

stringi的救援包再次! 最简单和优雅的解决方案中提出的。

stri_sub函数允许您提取字符串的一部分并替换其中的一部分，如下所示:

x <- "abcde"
stri_sub(x, 1, 3) # from first to third character
# [1] "abc"
stri_sub(x, 1, 3) <- 1 # substitute from first to third character
x
# [1] "1de"

但如果你这样做:

x <- "abcde"
stri_sub(x, 3, 2) # from 3 to 2 so... zero ?
# [1] ""
stri_sub(x, 3, 2) <- 1 # substitute from 3 to 2 ... hmm
x
# [1] "ab1cde"

然后不删除任何字符，但插入新字符。这不是很酷吗? :)

小开

我已经创建了一个名为 substr1的自定义函数来处理字符串中的提取、替换和插入字符。在每个会话开始时运行这些代码。请随意试用，如果需要改进请告诉我。

# extraction
substr1 <- function(x,y) {
z <- sapply(strsplit(as.character(x),''),function(w) paste(na.omit(w[y]),collapse=''))
dim(z) <- dim(x)
return(z) }


# substitution + insertion
`substr1<-` <- function(x,y,value) {
names(y) <- c(value,rep('',length(y)-length(value)))
z <- sapply(strsplit(as.character(x),''),function(w) {
v <- seq(w)
names(v) <- w
paste(names(sort(c(y,v[setdiff(v,y)]))),collapse='') })
dim(z) <- dim(x)
return(z) }


# demonstration
abc <- 'abc'
substr1(abc,1)
# "a"
substr1(abc,c(1,3))
# "ac"
substr1(abc,-1)
# "bc"
substr1(abc,1) <- 'A'
# "Abc"
substr1(abc,1.5) <- 'A'
# "aAbc"
substr1(abc,c(0.5,2,3)) <- c('A','B')
# "AaB"

小开

我花了一些时间来理解正则表达式，之后我找到了我的方法与数字，我有

最终的结果是

old <- "89580000"
gsub('^([0-9]{5})([0-9]+)$', '\\1-\\2', old)

小开

和你的差不多！

首先确保加载 tidyverse 包，然后同时使用 paste0和 gsub。

下面是准确的密码:

paste0(substr(old, 1,3), "d", substr(old,4,6))