从列表或元组中显式选择项

我有以下 Python 列表(也可以是 tuple) :

myList = ['foo', 'bar', 'baz', 'quux']

可以这么说

>>> myList[0:3]
['foo', 'bar', 'baz']
>>> myList[::2]
['foo', 'baz']
>>> myList[1::2]
['bar', 'quux']

如何显式地挑选索引没有特定模式的项目?例如,我想选择 [0,2,3]。或者从一个非常大的1000个项目的列表中,我想选择 [87, 342, 217, 998, 500]。有没有什么 Python 语法可以做到这一点?看起来像是:

>>> myBigList[87, 342, 217, 998, 500]
422849 次浏览

这个怎么样:

from operator import itemgetter
itemgetter(0,2,3)(myList)
('foo', 'baz', 'quux')
list( myBigList[i] for i in [87, 342, 217, 998, 500] )

我将这些答案与 python 2.5.2进行了比较:

  • 19.7 usec: [ myBigList[i] for i in [87, 342, 217, 998, 500] ]

  • 20.6 usec: map(myBigList.__getitem__, (87, 342, 217, 998, 500))

  • 22.7 usec: itemgetter(87, 342, 217, 998, 500)(myBigList)

  • 24.6 usec: list( myBigList[i] for i in [87, 342, 217, 998, 500] )

注意,在 Python3中,第1个被更改为与第4个相同。


另一种选择是从 numpy.array开始,它允许通过列表或 numpy.array进行索引:

>>> import numpy
>>> myBigList = numpy.array(range(1000))
>>> myBigList[(87, 342, 217, 998, 500)]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: invalid index
>>> myBigList[[87, 342, 217, 998, 500]]
array([ 87, 342, 217, 998, 500])
>>> myBigList[numpy.array([87, 342, 217, 998, 500])]
array([ 87, 342, 217, 998, 500])

tuple的工作方式与切片不同。

它不是内置的,但是如果您愿意,您可以创建一个以元组作为“索引”的 list 子类:

class MyList(list):


def __getitem__(self, index):
if isinstance(index, tuple):
return [self[i] for i in index]
return super(MyList, self).__getitem__(index)




seq = MyList("foo bar baaz quux mumble".split())
print seq[0]
print seq[2,4]
print seq[1::2]

印刷

foo
['baaz', 'mumble']
['bar', 'quux']

也许列表内涵是对的:

L = ['a', 'b', 'c', 'd', 'e', 'f']
print [ L[index] for index in [1,3,5] ]

制作:

['b', 'd', 'f']

这就是你想要的吗?

>>> map(myList.__getitem__, (2,2,1,3))
('baz', 'baz', 'bar', 'quux')

如果希望能够执行 myList[(2,2,1,3)],还可以创建自己的 List类,该类支持将元组作为 __getitem__的参数。

我只是想指出,即使 itemgetter 的语法看起来非常整洁,但是在大列表上执行时有点慢。

import timeit
from operator import itemgetter
start=timeit.default_timer()
for i in range(1000000):
itemgetter(0,2,3)(myList)
print ("Itemgetter took ", (timeit.default_timer()-start))

Itemgetter 拍摄了1.065209062149279

start=timeit.default_timer()
for i in range(1000000):
myList[0],myList[2],myList[3]
print ("Multiple slice took ", (timeit.default_timer()-start))

多重切片0.6225321444745759

另一种可能的解决办法是:

sek=[]
L=[1,2,3,4,5,6,7,8,9,0]
for i in [2, 4, 7, 0, 3]:
a=[L[i]]
sek=sek+a
print (sek)

通常当你有一个像 mask这样的布尔型数组

[mylist[i] for i in np.arange(len(mask), dtype=int)[mask]]

适用于任何序列或 np.array 的 lambda:

subseq = lambda myseq, mask : [myseq[i] for i in np.arange(len(mask), dtype=int)[mask]]

newseq = subseq(myseq, mask)

下面是一行 lambda:

list(map(lambda x: mylist[x],indices))

地点:

mylist=['a','b','c','d','e','f','g','h','i','j']
indices = [3, 5, 0, 2, 6]

产出:

['d', 'f', 'a', 'c', 'g']