Numpy在这里函数多个条件

我有一个名为dists的距离数组。我想在一个范围内选择dists

 dists[(np.where(dists >= r)) and (np.where(dists <= r + dr))]

但是,这只选择条件

 (np.where(dists <= r + dr))

如果我使用临时变量按顺序执行命令,它可以很好地工作。为什么上面的代码不能工作,我如何让它工作?

505961 次浏览

你的具体情况中最好的方法是将你的两个标准改为一个标准:

dists[abs(dists - r - dr/2.) <= dr/2.]

它只创建了一个布尔数组,在我看来更容易阅读,因为它说,__ABC0在__ABC1或r中?(虽然我将重新定义r为你感兴趣的区域的中心,而不是开始,所以r = r + dr/2.),但这并没有回答你的问题。


< p > 你问题的答案是: < br > 如果你只是想过滤掉dists中不符合你的标准的元素,你实际上不需要where:

dists[(dists >= r) & (dists <= r+dr)]

因为&会给你一个elementwise and(括号是必要的)。

或者,如果你出于某种原因想要使用where,你可以这样做:

 dists[(np.where((dists >= r) & (dists <= r + dr)))]

< p > 原因: < br > 它不起作用的原因是np.where返回一个索引列表,而不是一个布尔数组。你试图在两个数字列表之间获得and,当然它没有你期望的True/False值。如果ab都是True值,则a and b返回b。因此,像[0,1,2] and [2,3,4]这样的语句只会给你and0。这里是它在行动:

In [230]: dists = np.arange(0,10,.5)
In [231]: r = 5
In [232]: dr = 1


In [233]: np.where(dists >= r)
Out[233]: (array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19]),)


In [234]: np.where(dists <= r+dr)
Out[234]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)


In [235]: np.where(dists >= r) and np.where(dists <= r+dr)
Out[235]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)

例如,您希望比较的只是布尔数组

In [236]: dists >= r
Out[236]:
array([False, False, False, False, False, False, False, False, False,
False,  True,  True,  True,  True,  True,  True,  True,  True,
True,  True], dtype=bool)


In [237]: dists <= r + dr
Out[237]:
array([ True,  True,  True,  True,  True,  True,  True,  True,  True,
True,  True,  True,  True, False, False, False, False, False,
False, False], dtype=bool)


In [238]: (dists >= r) & (dists <= r + dr)
Out[238]:
array([False, False, False, False, False, False, False, False, False,
False,  True,  True,  True, False, False, False, False, False,
False, False], dtype=bool)

现在你可以在组合布尔数组上调用np.where:

In [239]: np.where((dists >= r) & (dists <= r + dr))
Out[239]: (array([10, 11, 12]),)


In [240]: dists[np.where((dists >= r) & (dists <= r + dr))]
Out[240]: array([ 5. ,  5.5,  6. ])

或者使用的索引简单地用布尔数组索引原始数组

In [241]: dists[(dists >= r) & (dists <= r + dr)]
Out[241]: array([ 5. ,  5.5,  6. ])

我已经算出了这个简单的例子

import numpy as np


ar = np.array([3,4,5,14,2,4,3,7])


print [X for X in list(ar) if (X >= 3 and X <= 6)]


>>>
[3, 4, 5, 4, 3]

试一试:

np.intersect1d(np.where(dists >= r)[0],np.where(dists <= r + dr)[0])

公认的答案很好地解释了这个问题。然而,应用多个条件的更Numpythonic方法是使用Numpy逻辑函数。在这种情况下,你可以使用np.logical_and:

np.where(np.logical_and(np.greater_equal(dists,r),np.greater_equal(dists,r + dr)))

我喜欢使用np.vectorize来完成这样的任务。考虑以下几点:

>>> # function which returns True when constraints are satisfied.
>>> func = lambda d: d >= r and d<= (r+dr)
>>>
>>> # Apply constraints element-wise to the dists array.
>>> result = np.vectorize(func)(dists)
>>>
>>> result = np.where(result) # Get output.

你也可以使用np.argwhere代替np.where来获得清晰的输出。

这应该可以工作:

dists[((dists >= r) & (dists <= r+dr))]

试一试:

import numpy as np
dist = np.array([1,2,3,4,5])
r = 2
dr = 3
np.where(np.logical_and(dist> r, dist<=r+dr))

输出:(数组([2,3,4]),)

你可以查看逻辑功能获取更多细节。

这里有一件有趣的事;通常使用的方式也可以在这种情况下工作,但有一个小的变化。而不是“and”和“or”,而是使用& (,)管道操作符(|),它会工作。

当我们使用”和“时:

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) and (ar<6), 'yo', ar)


Output:
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

当我们使用& (,)时:

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) & (ar<6), 'yo', ar)


Output:
array(['3', 'yo', 'yo', '14', '2', 'yo', '3', '7'], dtype='<U11')

当我们在pandas数据框架中应用多个过滤器时,情况也是如此。现在,这背后的原因必须与逻辑运算符和位运算符做一些事情,为了更好地理解相同,我建议在stackoverflow中查看这个回答或类似的Q/A。

更新

一个用户问,为什么括号里需要给出(ar>3)和(ar<6)。事情是这样的。在我开始讨论这里发生的事情之前,需要了解Python中的操作符优先级。

与BODMAS类似,python也会优先考虑应该首先执行的操作。括号内的项首先执行,然后按位操作符开始工作。下面我将展示在使用和不使用"(",")"的两种情况下发生的情况。

Case1:

np.where( ar>3 & ar<6, 'yo', ar)
np.where( np.array([3,4,5,14,2,4,3,7])>3 & np.array([3,4,5,14,2,4,3,7])<6, 'yo', ar)

由于这里没有括号,位操作符(&)在这里会感到困惑,你甚至要求它获取逻辑与,因为在操作符优先级表中,如果你看到,&优先于<>操作符。这是从最低优先级到最高优先级的表格。

enter image description here

它甚至没有执行<>操作,并被要求执行逻辑与操作。这就是它给出错误的原因。

可以查看以下链接了解更多信息:操作符 优先< / > < / p >

现在来看情况2:

如果使用括号,可以清楚地看到发生了什么。

np.where( (ar>3) & (ar<6), 'yo', ar)
np.where( (array([False,  True,  True,  True, False,  True, False,  True])) & (array([ True,  True,  True, False,  True,  True,  True, False])), 'yo', ar)

True和False的两个数组。并且可以很容易地对它们进行逻辑与操作。这就给了你:

np.where( array([False,  True,  True, False, False,  True, False, False]),  'yo', ar)

剩下的,np。其中,对于给定的情况,只要True,赋第一个值(即。这里是'yo'),如果为False,则另一个(即。这里,保留原件)。

这是所有。我希望我很好地解释了这个问题。

要让np.where()在多个条件下工作,只需执行以下操作:

np.where((condition 1) & (condition 2)) # for and
np.where((condition 1) | (condition 2)) # for or

我知道这重复了一些其他的答案,但我把这个简单的答案放在这里,因为人们仍然在想,“为什么我收到关于__abc0的恼人错误消息”;他们被非常冗长和复杂的回答所迷惑,这些回答是为了解决原始帖子的一些专业性质。

现在,当你使用and而不是&时,关于为什么 numpy中断,我不会在这里回答这个问题。它就是这样:)在这里看到其他答案的解释。在我看来,这似乎是他们应该解决的问题,而不是为了一致性而强迫它。或者至少他们应该给出更好的错误消息。:)