在 Bash 中访问字符串的最后 x 个字符

我发现使用 ${string:0:3}可以访问字符串的前3个字符。是否有一个同样容易的方法来访问最后三个字符?

199126 次浏览

你可以使用 tail:

$ foo="1234567890"
$ echo -n $foo | tail -c 3
890

获得最后三个字符的一个有点迂回的方法是这样说:

echo $foo | rev | cut -c1-3 | rev

string的最后三个字符:

${string: -3}

或者

${string:(-3)}

(注意第一种形式中 :-3之间的空格)。

请参阅 参考手册中的壳参数展开:

${parameter:offset}
${parameter:offset:length}


Expands to up to length characters of parameter starting at the character
specified by offset. If length is omitted, expands to the substring of parameter
starting at the character specified by offset. length and offset are arithmetic
expressions (see Shell Arithmetic). This is referred to as Substring Expansion.


If offset evaluates to a number less than zero, the value is used as an offset
from the end of the value of parameter. If length evaluates to a number less than
zero, and parameter is not ‘@’ and not an indexed or associative array, it is
interpreted as an offset from the end of the value of parameter rather than a
number of characters, and the expansion is the characters between the two
offsets. If parameter is ‘@’, the result is length positional parameters
beginning at offset. If parameter is an indexed array name subscripted by ‘@’ or
‘*’, the result is the length members of the array beginning with
${parameter[offset]}. A negative offset is taken relative to one greater than the
maximum index of the specified array. Substring expansion applied to an
associative array produces undefined results.


Note that a negative offset must be separated from the colon by at least one
space to avoid being confused with the ‘:-’ expansion. Substring indexing is
zero-based unless the positional parameters are used, in which case the indexing
starts at 1 by default. If offset is 0, and the positional parameters are used,
$@ is prefixed to the list.

由于这个答案有一些常规的视图,让我添加一个可能性来解决 约翰 · 里克斯的注释; 正如他提到的,如果您的字符串的长度小于3,${string: -3}扩展为空字符串。在这种情况下,如果希望扩展 string,可以使用:

${string:${#string}<3?0:-3}

这使用了 ?:三元 if 操作符,可以在 壳算法中使用; 因为正如文档所述,偏移量是一个算术表达式,所以这是有效的。


POSIX 兼容解决方案的更新

前一部分给出了最佳选项 在使用巴斯的时候。如果您想要针对 POSIX shell,这里有一个选项(不使用管道或外部工具,如 cut) :

# New variable with 3 last characters removed
prefix=${string%???}
# The new string is obtained by removing the prefix a from string
newstring=${string#"$prefix"}

这里需要注意的主要问题之一是使用引用 prefix 在里面的参数展开。这一点在 POSIX 裁判中已经提到(在本节的末尾) :

以下四种参数扩展形式用于子串处理。在每种情况下,应使用模式匹配符号(见模式匹配符号)而不是正则表达式符号来评估模式。如果参数是“ #”、“ *”或“@”,则未指定展开的结果。如果参数未设置且 set-u 有效,则展开将失败。用双引号括起全参数扩展字符串不得引起下列四种格式字符的引用,而大括号中的引号字符应具有这种效果。在每种格式字符中,如省略单词,应使用空格。

如果您的字符串包含特殊字符,这一点很重要,

$ string="hello*ext"
$ prefix=${string%???}
$ # Without quotes (WRONG)
$ echo "${string#$prefix}"
*ext
$ # With quotes (CORRECT)
$ echo "${string#"$prefix"}"
ext

当然,这只有在提前知道字符数时才有用,因为您必须在参数展开中硬编码 ?的数目; 但是在这种情况下,这是一个很好的可移植解决方案。

另一个变通方法是使用 grep -o和一点正则表达式魔术,得到三个字符后跟行尾:

$ foo=1234567890
$ echo $foo | grep -o ...$
890

如果字符串小于3个字符,可以选择获取1到3个最后的字符,可以使用 egrep和 regex:

$ echo a | egrep -o '.{1,3}$'
a
$ echo ab | egrep -o '.{1,3}$'
ab
$ echo abc | egrep -o '.{1,3}$'
abc
$ echo abcd | egrep -o '.{1,3}$'
bcd

您还可以使用不同的范围,比如 5,10来获取最后5到10个字符。

1. 广义子字符串

为了概括 niourf _ niourf 的问题和答案(因为这正是我所寻找的) ,如果你想把字符的 射程从末尾的第7个字符剪切到末尾的第3个字符,你可以使用以下语法:

${string: -7:4}

其中4是课程的长度(7-3)。

2. 使用切割的替代方法

另外,niourf _ niourf 的解决方案显然是最好和最简洁的,我只是想使用 cut添加一个替代解决方案:

echo $string | cut -c $((${#string}-2))-

在这里,${#string}是字符串的长度,而尾随的“-”表示切到字符串的末尾。

3. 使用 awk 的替代方法

这个解决方案使用 awk的子字符串函数来选择一个子字符串,如果省略了长度,那么它的语法 substr(string, start, length)将到达末尾。因此,length($string)-2)提取最后三个字符。

echo $string | awk '{print substr($1,length($1)-2) }'