bash中的字符串长度

如何获取存储在变量中的字符串长度并将其赋值给另一个变量?

myvar="some string"
echo ${#myvar}
# 11

如何将另一个变量设置为输出11?

693854 次浏览

要获取存储在变量中的字符串长度,可以这样做:

myvar="some string"
size=${#myvar}

要确认它被正确保存,echo它:

$ echo "$size"
11

如果你想在命令行或函数参数中使用它,请确保使用size=${#1}而不是size=${#$1}。第二个可能更符合直觉,但语法不正确。

你可以使用:

MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
  • wc -cwc --bytes字节计数= Unicode字符以2,3或更多字节计数。
  • wc -mwc --chars用于字符计数= Unicode字符单独计数,直到它们使用更多字节为止。

UTF-8字符串长度

除了费多基的正确答案,我想显示string length和byte length之间的差异:

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen

将呈现:

Généralités is 11 char len, but 14 bytes len.

你甚至可以看看存储的字符:

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"

会回答:

Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').

根据伊莎贝尔·考恩的评论,我已经添加了设置$LC_ALL$LANG

一个参数的长度,工作样本

参数的工作原理与常规变量相同

showStrLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}

将作为

showStrLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'

有用的printf校正工具:

如果你:

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'"  ${#string}
done


- 'Généralités' is 11 char length
- 'Language'     is  8 char length
- 'Théorème'   is  8 char length
- 'Février'     is  7 char length
- 'Left: ←'    is  7 char length
- 'Yin Yang ☯' is 10 char length

不是真正的漂亮的输出!

这里有一个小函数:

strU8DiffLen() {
local charlen=${#1} LANG=C LC_ALL=C
return $(( ${#1} - charlen ))
}

或写成一行:

strU8DiffLen() { local chLen=${#1} LANG=C LC_ALL=C;return $((${#1}-chLen));}

然后现在:

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done


- 'Généralités'  is 11 chars length, but uses 14 bytes
- 'Language'     is  8 chars length, but uses  8 bytes
- 'Théorème'     is  8 chars length, but uses 10 bytes
- 'Février'      is  7 chars length, but uses  8 bytes
- 'Left: ←'      is  7 chars length, but uses  9 bytes
- 'Yin Yang ☯'   is 10 chars length, but uses 12 bytes

不幸的是,这并不完美!

但有一些奇怪的UTF-8行为,如双倍行距字符,零行距字符,反向置换和其他不可能那么简单…

查看diffU8test.shdiffU8test.sh.txt,了解更多限制。

在回复帖子开头时:

如果你想在命令行或函数参数中使用这个…

代码:

size=${#1}

可能有这样的情况,你只是想检查一个零长度的参数,而不需要存储一个变量。我相信你可以使用这样的语法:

if [ -z "$1" ]; then
#zero length argument
else
#non-zero length
fi

有关Bash条件表达式的更完整列表,请参阅GNUwooledge

下面是计算变量长度的几种方法:

echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'

要在另一个变量中设置结果,只需将上面的命令赋值给另一个变量,如下所示:

otherVar=`echo -n $VAR | wc -m`
echo $otherVar

http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html

我想要一个最简单的例子,结果是这样的:

echo -n 'Tell me the length of this sentence.' | wc -m;
36

使用你提供的例子

#KISS (Keep it simple stupid)
size=${#myvar}
echo $size
我知道问题和回答已经够老了,但今天我第一次面对这个任务。通常我使用${#var}组合,但它在unicode中失败:我用bash处理的大多数文本都是西里尔字母… 基于@atesin的回答,我编写了一个简短的(准备更简短)函数,可以用于脚本编写。这是一个让我想到这个问题的任务:在伪图形盒中显示一些可变长度的信息。这里是

$ cat draw_border.sh
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
local BPAR="$1"
local BPLEN=`echo $BPAR|wc -m`
local OUTLINE=\|\ "$1"\ \|
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(($BPLEN+1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER
echo $OUTLINE
echo $OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"

这个样本产生了什么:

$ draw_border.sh
+-------------+
| Généralités |
+-------------+
+----------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+----------------------------------+
+--------------+
| pure ENGLISH |
+--------------+

第一个例子(法语?)取自上面某人的例子。 第二个组合了西里尔字母和某个变量的值。第三个是自解释的:只有1s /2个ASCII字符

我使用echo $BPAR|wc -m而不是printf ...,以便不依赖于printf是否是内置的。

上面我看到了关于尾随换行符和echo-n参数的讨论。我没有使用它,因此我只添加了一个到$BPLEN。如果我使用-n,我必须添加2。

要解释wc -mwc -c之间的区别,请查看相同的脚本,只有一个微小的更改:-m-c取代

$ draw_border.sh
+----------------+
| Généralités |
+----------------+
+---------------------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+---------------------------------------------+
+--------------+
| pure ENGLISH |
+--------------+

拉丁字母中的重音字符,以及西里尔字母中的大多数字符都是两个字节,因此绘制的水平长度大于消息的实际长度。 希望,它会节省一些时间:-)

附注:俄语文本说“这里还有一个”;

p.p.s.工作“双线”;

#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(( $(echo "$1"|wc -m) +1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER"\n"\|\ "$1"\ \|"\n"$OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"

为了避免重复绘制OUTBORDER的代码,我将OUTBORDER的形成放在单独的命令中

也许只需要使用wc -c来计算字符数:

myvar="Hello, I am a string."
echo -n $myvar | wc -c

结果:

21

bash中的字符串长度

str="Welcome to Stackoveflow"
length=`expr length "$str"`
  

echo "Length of '$str' is $length"

输出

“欢迎来到stackoverflow”的长度是23