用grep在一行中匹配两个字符串

小开

正则表达式中的|操作符表示或。也就是说，string1或string2将匹配。你可以这样做:

grep 'string1' filename | grep 'string2'

它将把第一个命令的结果输送到第二个grep中。这应该只会给出两者都匹配的行。

小开

你可以尝试这样做:

(pattern1.*pattern2|pattern2.*pattern1)

小开

你应该有这样的grep:

$ grep 'string1' file | grep 'string2'

小开

最佳答案

你可以使用

grep 'string1' filename | grep 'string2'

或

grep 'string1.*string2\|string2.*string1' filename

小开

如果你有一个带有-P选项的grep，用于有限的perl正则表达式，你可以使用

grep -P '(?=.*string1)(?=.*string2)'

它的优点是处理重叠的字符串。使用perl作为grep有点更直接，因为你可以更直接地指定和逻辑:

perl -ne 'print if /string1/ && /string2/'

小开

我觉得这就是你想要的

grep -E "string1|string2" filename

我认为答案是这样的:

grep 'string1.*string2\|string2.*string1' filename

只匹配两者都存在的情况，而不是其中一个或另一个或两者都存在的情况。

小开

对于多行匹配:

echo -e "test1\ntest2\ntest3" |tr -d '\n' |grep "test1.*test3"

或

echo -e "test1\ntest5\ntest3" >tst.txt
cat tst.txt |tr -d '\n' |grep "test1.*test3\|test3.*test1"

我们只需要删除换行符，它就工作了!

小开

在任意位置搜索包含所有单词的任意顺序的文件:

grep -ril \'action\' | xargs grep -il \'model\' | xargs grep -il \'view_type\'

第一个grep开始递归搜索(r)，忽略大小写(i)，并列出(打印出)文件中任何地方出现的一个项('action'带单引号)匹配(l)的文件名。

后续的grep搜索其他术语，保留大小写不敏感并列出匹配文件。

您将获得的最终文件列表将是包含这些术语的文件，在文件的任何位置以任意顺序排列。

小开

你的方法几乎很好，只是少了一个-w

grep -w 'string1\|string2' filename

小开

将您想要grep的字符串放入文件中

echo who    > find.txt
echo Roger >> find.txt
echo [44][0-9]{9,} >> find.txt

然后使用-f进行搜索

grep -f find.txt BIG_FILE_TO_SEARCH.txt

小开

发现仅以6个空格开始并以以下内容结束的行:

 cat my_file.txt | grep
-e '^      .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
-e '^      .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
> nolog.txt

小开

grep '(string1.*string2 | string2.*string1)' filename

将得到line与string1和string2在任何顺序

小开

我经常遇到和你一样的问题，我刚刚写了一段脚本:

function m() { # m means 'multi pattern grep'


function _usage() {
echo "usage: COMMAND [-inH] -p<pattern1> -p<pattern2> <filename>"
echo "-i : ignore case"
echo "-n : show line number"
echo "-H : show filename"
echo "-h : show header"
echo "-p : specify pattern"
}


declare -a patterns
# it is important to declare OPTIND as local
local ignorecase_flag  filename linum header_flag colon result OPTIND


while getopts "iHhnp:" opt; do
case $opt in
i)
ignorecase_flag=true ;;
H)
filename="FILENAME," ;;
n)
linum="NR," ;;
p)
patterns+=( "$OPTARG" ) ;;
h)
header_flag=true ;;
\?)
_usage
return ;;
esac
done


if [[ -n $filename || -n $linum ]]; then
colon="\":\","
fi


shift $(( $OPTIND - 1 ))


if [[ $ignorecase_flag == true ]]; then
for s in "${patterns[@]}"; do
result+=" && s~/${s,,}/"
done
result=${result# && }
result="{s=tolower(\$0)} $result"
else
for s in "${patterns[@]}"; do
result="$result && /$s/"
done
result=${result# && }
fi


result+=" { print "$filename$linum$colon"\$0 }"


if [[ ! -t 0 ]]; then       # pipe case
cat - | awk "${result}"
else
for f in "$@"; do
[[ $header_flag == true ]] && echo "########## $f ##########"
awk "${result}" $f
done
fi
}

用法:

echo "a b c" | m -p A
echo "a b c" | m -i -p A # a b c

你可以把它放在。bashrc中。

小开

假设我们需要在文件testfile中找到多个单词的计数。有两种方法可以实现

1)使用grep命令与regex匹配模式

grep -c '\<\(DOG\|CAT\)\>' testfile

2)使用egrep命令

egrep -c 'DOG|CAT' testfile

使用egrep，您无需担心表达式，只需通过管道分离器分离单词。

小开

正如人们建议的perl和python，以及复杂的shell脚本，这里有一个简单的awk方法:

awk '/string1/ && /string2/' filename

看了评论，得到了公认的答案:不，这没有多行;但这也不是问题作者想要的。

小开

grep -i -w 'string1\|string2' filename

这适用于精确的单词匹配和匹配不区分大小写的单词，为此使用-i

小开

不要尝试使用grep，而是使用awk。为了匹配grep中的2个regexp R1和R2，你会认为它会是:

grep 'R1.*R2|R2.*R1'

而在awk中则是:

awk '/R1/ && /R2/'

但如果R2与R1重叠或是R1的子集呢?grep命令根本不起作用，而awk命令可以。假设你想找到包含the和heat的行:

$ echo 'theatre' | grep 'the.*heat|heat.*the'
$ echo 'theatre' | awk '/the/ && /heat/'
theatre

你必须使用2个grep和一个管道:

$ echo 'theatre' | grep 'the' | grep 'heat'
theatre

当然，如果你真的需要它们是分开的，你总是可以在awk中编写与在grep中使用的相同的regexp，并且有其他的awk解决方案，不需要在每个可能的顺序中重复regexp。

撇开这个不谈，如果您想扩展您的解决方案以匹配3个regexp R1、R2和R3呢?在grep中，这是一个糟糕的选择:

grep 'R1.*R2.*R3|R1.*R3.*R2|R2.*R1.*R3|R2.*R3.*R1|R3.*R1.*R2|R3.*R2.*R1' file
grep R1 file | grep R2 | grep R3

而在awk中，它是简洁、明显、简单、高效的:

awk '/R1/ && /R2/ && /R3/'

现在，如果您实际上想匹配字面字符串S1和S2而不是正则表达式R1和R2呢?你不能在一次调用grep中就做到这一点，你必须在调用grep之前编写代码来转义所有的RE元字符:

S1=$(sed 's/[^^]/[&]/g; s/\^/\\^/g' <<< 'R1')
S2=$(sed 's/[^^]/[&]/g; s/\^/\\^/g' <<< 'R2')
grep 'S1.*S2|S2.*S1'

或者再次使用2个grep和一个管道:

grep -F 'S1' file | grep -F 'S2'

这也是糟糕的选择，而在awk中，您只需使用字符串操作符而不是regexp操作符:

awk 'index($0,S1) && index($0.S2)'

现在，如果您想在一个段落而不是一行中匹配2个regexp呢?不能在grep中完成，在awk中是微不足道的:

awk -v RS='' '/R1/ && /R2/'

那么跨整个文件呢?同样不能在grep中完成，在awk中是微不足道的(这次我使用GNU awk用于多字符RS，为了简洁，但在任何awk中都没有太多代码，或者你可以选择一个你知道不会在RS输入中的control-char来做同样的事情):

awk -v RS='^$' '/R1/ && /R2/'

因此，如果你想在一行、段落或文件中找到多个regexp或字符串，那么不要使用grep，使用awk。

小开

`git grep`

下面是使用多个模式的git grep的语法:

git grep --all-match --no-index -l -e string1 -e string2 -e string3 file

你也可以将模式与布尔表达式组合，如--and， --or和--not。

检查man git-grep寻求帮助。

--all-match当给出多个模式表达式时，此标志被指定为将匹配限制在具有匹配所有行的文件上。

--no-index 搜索当前目录下不受Git管理的文件。

-l/--files-with-matches/--name-only只显示文件名。

-e下一个参数是模式。默认是使用基本的regexp。

其他需要考虑的参数:

--threads使用的grep工作线程数。

-q/--quiet/--silent不输出匹配的行;当有匹配时，以状态0退出。

要改变模式类型，你也可以使用-G/--basic-regexp(默认)，-F/--fixed-strings， -E/--extended-regexp， -P/--perl-regexp， -f file等。

`ripgrep`

下面是使用rg的例子:

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的grepping工具之一，因为它是建立在Rust的正则表达式引擎之上的，它使用有限自动机，SIMD和积极的文字优化来使搜索非常快。

使用它，特别是在处理大量数据时。

^{另见相关功能请求at GH-875。}

小开

grep ‘string1\|string2’ FILENAME

GNU grep 3.1版

小开

当两个字符串按顺序排列时，使用grep命令在两者之间放置一个模式:

$ grep -E "string1(?.*)string2" file

如果以下行包含在名为Dockerfile的文件中:

FROM python:3.8 as build-python
FROM python:3.8-slim

要获取包含字符串:FROM python和as build-python的行，请使用:

$ grep -E "FROM python:(?.*) as build-python" Dockerfile

然后输出将只显示包含两个字符串的行:

FROM python:3.8 as build-python

小开

如果git被初始化并添加到分支，那么最好使用git grep，因为它非常快，它会在整个目录内搜索。

git grep 'string1.*string2.*string3'

小开

搜索两个`String`，只突出显示`string1`和`string2`

grep -E 'string1.*string2|string2.*string1' filename | grep -E 'string1|string2'

或

grep 'string1.*string2\|string2.*string1' filename | grep -E 'string1\|string2'

用grep在一行中匹配两个字符串

git grep

ripgrep

搜索两个String，只突出显示string1和string2

`git grep`

`ripgrep`

搜索两个`String`，只突出显示`string1`和`string2`