只打印匹配组

我想获取最后两个数字(一个 int,一个 float; 后跟可选的空格)并只打印它们。

例如:

foo bar <foo> bla 1 2 3.4

应该打印:

2 3.4

到目前为止,我得到了以下信息:

sed -n  's/\([0-9][0-9]*[\ \t][0-9.]*[\ \t]*$\)/replacement/p'

会给我

foo bar <foo> bla 1 replacement

但是,如果我尝试用第1组替换它,则会打印整行代码。

sed -n  's/\([0-9][0-9]*[\ \t][0-9.]*[\ \t]*$\)/\1/p'

如何只打印与组中的正则表达式匹配的行部分?

307972 次浏览

匹配整行,因此在正则表达式的开头添加一个 .*。这会导致用组的内容替换整行

echo "foo bar <foo> bla 1 2 3.4" |
sed -n  's/.*\([0-9][0-9]*[\ \t][0-9.]*[ \t]*$\)/\1/p'
2 3.4

Grep 是正确的提取工具。

使用你的例子和正则表达式:

kent$  echo 'foo bar <foo> bla 1 2 3.4'|grep -o '[0-9][0-9]*[\ \t][0-9.]*[\ \t]*$'
2 3.4

还有一个选择,我选 awk!

echo "foo bar <foo> bla 1 2 3.4" | awk '{ print $(NF-1), $NF; }'

这将在空格上分割输入(我在这里使用的是 STDIN,但是您的输入很可能是一个文件) ,然后打印出最后但是一个字段,然后打印出最后一个字段。$NF变量保存在空格上爆炸后找到的字段数。

这样做的好处是,最后两个字段之前的内容是否改变并不重要,只要您只想要最后两个字段,它就会继续工作。

Cut 命令就是为这种情况设计的。它将在任何分隔符上“剪切”,然后您可以指定应该输出哪些块。

例如: echo "foo bar <foo> bla 1 2 3.4" | cut -d " " -f 6-7

将产生以下结果: 2 3.4

D 设置分隔符

- f 选择要输出的字段范围,在本例中,它是原始字符串的第6到第7个块。还可以将范围指定为列表,如 6,7

我同意 @ Kent,这是非常适合 grep -o。如果需要在模式中提取组,可以使用第二个 grep。

# To extract \1 from /xx([0-9]+)yy/
$ echo "aa678bb xx123yy xx4yy aa42 aa9bb" | grep -Eo 'xx[0-9]+yy' | grep -Eo '[0-9]+'
123
4


# To extract \1 from /a([0-9]+)b/
$ echo "aa678bb xx123yy xx4yy aa42 aa9bb" | grep -Eo 'a[0-9]+b' | grep -Eo '[0-9]+'
678
9

当我看到两个 grep/sed/awk 调用通过管道连接在一起时,我通常会感到害怕,但这并不总是错误的。虽然我们应该锻炼我们的技能做事情有效,“愚蠢的一致性是小心眼的妖怪”,和“真正的艺术家船”。