对于范围(N)内的 x: 如何选择给定条件的数组元素?


假设我有一个数字数组 x = [5, 2, 3, 1, 4, 5]y = ['f', 'o', 'o', 'b', 'a', 'r']。我想选择 y中与 x中大于1小于5的元素对应的元素。


x = array([5, 2, 3, 1, 4, 5])
y = array(['f','o','o','b','a','r'])
output = y[x > 1 & x < 5] # desired output is ['o','o','a']
>>> y[(1 < x) & (x < 5)]
array(['o', 'o', 'a'],
IMO OP 实际上并不需要 ABC0(又名 &),而是需要 np.logical_and(),因为他们比较的是逻辑值,比如 TrueFalse

>>> x = array([5, 2, 3, 1, 4, 5])
>>> y = array(['f','o','o','b','a','r'])
>>> output = y[np.logical_and(x > 1, x < 5)] # desired output is ['o','o','a']
>>> output
array(['o', 'o', 'a'],
等效的方法是使用 np.all(),通过适当地设置 axis参数。

>>> output = y[np.all([x > 1, x < 5], axis=0)] # desired output is ['o','o','a']
>>> output
array(['o', 'o', 'a'],
>>> %timeit (a < b) & (b < c)
100000 loops, best of 3: 1.15 µs per loop

>>> %timeit np.logical_and(a < b, b < c)
1000000 loops, best of 3: 1.17 µs per loop

>>> %timeit np.all([a < b, b < c], 0)
100000 loops, best of 3: 5.06 µs per loop
所以使用 np.all()比较慢,但是 &logical_and大致相同。

在@J. F. Sebastian 和@Mark Mikofski 的回答中添加一个细节:
如果想获得相应的索引(而不是数组的实际值) ,下面的代码可以做到:

select_indices = np.where( np.logical_and( x > 1, x < 5) )[0] #   1 < x <5


select_indices = np.where( np.logical_or( x < 1, x > 5 ) )[0] # x <1 or x >5
standard:  0.8398549720004667
underscore:  0.8413165839992871
loopiter:  0.7110594899968419
loopiter2:  0.5891903560004721

所以使用 map 比标准 for 循环提高了大约30% ,比 Martelli 的提高了19% 。


var iframe = document.createElement('iframe');
iframe.onload = function() { alert('myframe is loaded'); }; // before setting 'src'
iframe.src = '...';
document.body.appendChild(iframe); // add it to wherever you need it in the document

我喜欢使用 np.vectorize来完成这些任务:

>>> # Arrays
>>> x = np.array([5, 2, 3, 1, 4, 5])
>>> y = np.array(['f','o','o','b','a','r'])

>>> # Function containing the constraints
>>> func = np.vectorize(lambda t: t>1 and t<5)

>>> # Call function on x
>>> y[func(x)]
>>> array(['o', 'o', 'a'], dtype='<U1')

对于2D 数组,可以这样做。使用条件创建一个2D 掩码。根据数组类型转换条件掩码为 int 或 float,并将其与原始数组相乘。

In [8]: arr
array([[ 1.,  2.,  3.,  4.,  5.],
[ 6.,  7.,  8.,  9., 10.]])

In [9]: arr*(arr % 2 == 0).astype(np.int)
array([[ 0.,  2.,  0.,  4.,  0.],
[ 6.,  0.,  8.,  0., 10.]])