Multiprocessing a for loop?

小开

你可以使用 multiprocessing.Pool:

from multiprocessing import Pool
class Engine(object):
def __init__(self, parameters):
self.parameters = parameters
def __call__(self, filename):
sci = fits.open(filename + '.fits')
manipulated = manipulate_image(sci, self.parameters)
return manipulated


try:
pool = Pool(8) # on 8 processors
engine = Engine(my_parameters)
data_outputs = pool.map(engine, data_inputs)
finally: # To make sure processes are closed in the end, even if errors happen
pool.close()
pool.join()

小开

最佳答案

你可以简单地使用 multiprocessing.Pool:

from multiprocessing import Pool


def process_image(name):
sci=fits.open('{}.fits'.format(name))
<process>


if __name__ == '__main__':
pool = Pool()                         # Create a multiprocessing Pool
pool.map(process_image, data_inputs)  # process data_inputs iterable with pool

小开

或者

with Pool() as pool:
pool.map(fits.open, [name + '.fits' for name in datainput])

小开

如果只使用 for循环来迭代一个可迭代文件，我建议使用 imap_unordered和 chunksize。它将在计算每个循环的结果时立即返回这些结果。map等待所有结果被计算，因此被阻塞。