替换Python NumPy数组中所有大于某个值的元素

我有一个2D NumPy数组,想用255.0替换其中大于或等于阈值T的所有值。据我所知,最基本的方法是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
for y in range(0, shape[1]):
if arr[x, y] >= T:
result[x, y] = 255
  1. 最简洁和python化的方法是什么?

  2. 是否有更快(可能不那么简洁和/或不那么python化)的方法来做到这一点?

这将是人类头部MRI扫描的窗口/水平调整子程序的一部分。2D numpy数组是图像像素数据。

553613 次浏览

我认为最快和最简洁的方法是使用NumPy内置的Fancy索引。如果你有一个名为arrndarray,你可以用值x替换所有>255元素,如下所示:

arr[arr > 255] = x

我在我的机器上运行了一个500 x 500的随机矩阵,将所有值>0.5替换为5,平均耗时7.59ms。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop

因为你实际上想要一个不同的数组arr,其中arr < 255255,这可以简单地完成:

result = np.minimum(arr, 255)

更一般地说,对于下限和/或上限:

result = np.clip(arr, 0, 255)

如果你只是想访问255以上的值,或更复杂的值,@mtitan8的答案更一般,但np.clipnp.minimum(或np.maximum)对你的情况更好,更快:

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop


In [293]: %%timeit
.....: c = np.copy(a)
.....: c[a>255] = 255
.....:
10000 loops, best of 3: 86.6 µs per loop

如果你想就地执行(即修改arr而不是创建result),你可以使用np.minimumout参数:

np.minimum(arr, 255, out=arr)

np.clip(arr, 0, 255, arr)

(out=名称是可选的,因为参数的顺序与函数的定义相同。)

对于原地修改,布尔索引会加速很多(无需单独创建和修改副本),但仍然不如minimum快:

In [328]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: np.minimum(a, 255, a)
.....:
100000 loops, best of 3: 303 µs per loop


In [329]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: a[a>255] = 255
.....:
100000 loops, best of 3: 356 µs per loop

作为比较,如果你想用最小值和最大值来限制你的值,如果没有clip,你必须这样做两次,使用类似于

np.minimum(a, 255, a)
np.maximum(a, 0, a)

或者,

a[a>255] = 255
a[a<0] = 0

你可以考虑使用numpy.putmask .:

np.putmask(arr, arr>=T, 255.0)

下面是Numpy内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)


In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop


In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop

我认为你可以通过使用where函数来最快地实现这一点:

例如,在numpy数组中查找大于0.2的项,并将其替换为0:

import numpy as np


nums = np.random.rand(4,3)


print np.where(nums > 0.2, 0, nums)

另一种方法是使用np.place,它执行就地替换并与多维数组一起工作:

import numpy as np


# create 2x3 array with numbers 0..5
arr = np.arange(6).reshape(2, 3)


# replace 0 with -10
np.place(arr, arr == 0, -10)

你也可以使用&|(和/或)来获得更大的灵活性:

5到10之间的值:A[(A>5)&(A<10)]

值大于10或小于5:A[(A<5)|(A>10)]

让我们假设你有一个numpy数组,它包含了从0到20的值,你想用0替换大于10的数字

import numpy as np


my_arr = np.arange(0,21) # creates an array
my_arr[my_arr > 10] = 0 # modifies the value

请注意,这将修改原始数组,以避免覆盖原始数组,尝试使用arr.copy()来创建一个原始数组的新分离副本,并修改它。

import numpy as np


my_arr = np.arange(0,21)
my_arr_copy = my_arr.copy() # creates copy of the orignal array


my_arr_copy[my_arr_copy > 10] = 0

Np.where()工作得很好!

np.where(arr > 255, 255, arr)

例子:

FF = np.array([[0, 0],
[1, 0],
[0, 1],
[1, 1]])
np.where(FF == 1, '+', '-')
Out[]:
array([['-', '-'],
['+', '-'],
['-', '+'],
['+', '+']], dtype='<U1')