如何在Python中获取字符的位置?

如何在Python中获取字符串中字符的位置?

1425482 次浏览

有两个字符串方法,find()index()。两者的区别在于找不到搜索字符串时会发生什么。find()返回-1index()引发ValueError

使用find()

>>> myString = 'Position of a character'
>>> myString.find('s')
2
>>> myString.find('x')
-1

使用index()

>>> myString = 'Position of a character'
>>> myString.index('s')
2
>>> myString.index('x')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: substring not found

python手册

string.find(s, sub[, start[, end]])
返回中的最低索引,其中子字符串被找到,使得完全包含在s[start:end]中。失败时返回-1开始结束的默认值和负值的解释与切片相同。

还有:

string.index(s, sub[, start[, end]])
find()类似,但在找不到子字符串时引发ValueError

>>> s="mystring"
>>> s.index("r")
4
>>> s.find("r")
4

“长篇大论”的方式

>>> for i,c in enumerate(s):
...   if "r"==c: print i
...
4

要获取substring,

>>> s="mystring"
>>> s[4:10]
'ring'
string.find(character)
string.index(character)

也许你想看看留档,看看两者有什么区别。

当字符串包含重复字符时会发生什么? 根据我使用index()的经验,我看到对于重复,你会得到相同的索引。

例如:

s = 'abccde'
for c in s:
print('%s, %d' % (c, s.index(c)))

将返回:

a, 0
b, 1
c, 2
c, 2
d, 4

在这种情况下,你可以这样做:

for i, character in enumerate(my_string):
# i is the position of the character in the string

为了完整起见,如果您需要查找字符串中字符的所有位置,您可以执行以下操作:

s = 'shak#spea#e'
c = '#'
print([pos for pos, char in enumerate(s) if char == c])

将打印:[4, 9]

只是为了完成,如果我想在文件名中找到扩展名以检查它,我需要找到最后一个'.',在这种情况下使用rsearch:

path = 'toto.titi.tata..xls'
path.find('.')
4
path.rfind('.')
15

在我的情况下,我使用以下内容,无论完整的文件名是什么,它都有效:

filename_without_extension = complete_name[:complete_name.rfind('.')]

more_itertools.locate是一个第三方工具,用于查找满足条件的项目的所有指示。

这里我们找到字母"i"所有索引位置。

鉴于

import more_itertools as mit




text = "supercalifragilisticexpialidocious"
search = lambda x: x == "i"

代码

list(mit.locate(text, search))
# [8, 13, 15, 18, 23, 26, 30]

一个字符可能在字符串中出现多次。例如在字符串sentence中,e的位置是1, 4, 7(因为索引通常从零开始)。但我发现find()index()的两个函数都返回字符的第一个位置。所以,这个问题可以这样解决:

def charposition(string, char):
pos = [] #list to store positions for each 'char' in 'string'
for n in range(len(string)):
if string[n] == char:
pos.append(n)
return pos


s = "sentence"
print(charposition(s, 'e'))


#Output: [1, 4, 7]

使用numpy快速访问所有索引的解决方案:

string_array = np.array(list(my_string))
char_indexes = np.where(string_array == 'C')

如果你想找到第一场比赛。

Python有一个内置的字符串方法来完成这项工作:index()

string.index(value, start, end)

在哪里:

  • 值:(必填)要搜索的值。
  • start:(可选)从哪里开始搜索。默认值为0。
  • end:(可选)结束搜索的位置。默认值是字符串的末尾。
def character_index():
string = "Hello World! This is an example sentence with no meaning."
match = "i"
return string.index(match)
        

print(character_index())
> 15

如果你想找到所有的比赛。

假设您需要字符match所在的所有索引,而不仅仅是第一个。

Pythonic方法是使用enumerate()

def character_indexes():
string = "Hello World! This is an example sentence with no meaning."
match = "i"


indexes_of_match = []


for index, character in enumerate(string):
if character == match:
indexes_of_match.append(index)
return indexes_of_match


print(character_indexes())
# [15, 18, 42, 53]

或者使用列表理解更好:

def character_indexes_comprehension():
string = "Hello World! This is an example sentence with no meaning."
match = "i"


return [index for index, character in enumerate(string) if character == match]




print(character_indexes_comprehension())
# [15, 18, 42, 53]

我发现的大多数方法都是指查找字符串中的第一个子字符串。要找到所有子字符串,您需要解决。

例如:

定义字符串

vars='iloveyoutosimidaandilikeyou'

定义子字符串

key = 'you'

定义一个函数,可以找到字符串中所有子字符串的位置

def find_all_loc(vars, key):


pos = []
start = 0
end = len(vars)


while True:
loc = vars.find(key, start, end)
if  loc is -1:
break
else:
pos.append(loc)
start = loc + len(key)
            

return pos


pos = find_all_loc(vars, key)


print(pos)
[5, 24]
s = "This string containes spaces"
pos = s.index ("s")
print (pos) # 3