在 Python 中查找列表中的子字符串

背景:

示例列表: mylist = ['abc123', 'def456', 'ghi789']

我想检索一个元素,如果有一个匹配的子字符串,如 abc

密码:

sub = 'abc'
print any(sub in mystring for mystring in mylist)

如果列表中的任何元素包含该模式,则上面的命令将打印 True

我想打印匹配子字符串的元素。因此,如果我检查 'abc',我只想从列表中打印 'abc123'

343057 次浏览
print [s for s in list if sub in s]

如果希望用换行符将它们分开:

print "\n".join(s for s in list if sub in s)

完整的例子,不区分大小写:

mylist = ['abc123', 'def456', 'ghi789', 'ABC987', 'aBc654']
sub = 'abc'


print "\n".join(s for s in mylist if sub.lower() in s.lower())

使用一个简单的 for循环:

seq = ['abc123', 'def456', 'ghi789']
sub = 'abc'


for text in seq:
if sub in text:
print(text)

产量

abc123

这将打印包含 sub 的所有元素:

for s in filter (lambda x: sub in x, list): print (s)

我只是使用一个简单的 regex,你可以这样做

import re
old_list = ['abc123', 'def456', 'ghi789']
new_list = [x for x in old_list if re.search('abc', x)]
for item in new_list:
print item

所有的答案都有效,但是它们总是遍历整个列表。如果我理解你的问题,你只需要第一个匹配。因此,如果你找到了第一个匹配的对象,你不必考虑清单上的其他内容:

mylist = ['abc123', 'def456', 'ghi789']
sub = 'abc'
next((s for s in mylist if sub in s), None) # returns 'abc123'

如果匹配位于列表的末尾,或者对于非常小的列表,这没有什么区别,但是考虑一下这个例子:

import timeit


mylist = ['abc123'] + ['xyz123']*1000
sub = 'abc'


timeit.timeit('[s for s in mylist if sub in s]', setup='from __main__ import mylist, sub', number=100000)
# for me 7.949463844299316 with Python 2.7, 8.568840944994008 with Python 3.4
timeit.timeit('next((s for s in mylist if sub in s), None)', setup='from __main__ import mylist, sub', number=100000)
# for me 0.12696599960327148 with Python 2.7, 0.09955992100003641 with Python 3.4