每天,我都会收到大量的文件(更新)。我要做的是插入每个不存在的项。
I am using the Python driver (pymongo).
我现在所做的是(伪代码) :
for each document in update:
existing_document = collection.find_one(document)
if not existing_document:
document['insertion_date'] = now
else:
document = existing_document
document['last_update_date'] = now
my_collection.save(document)
我的问题是它非常慢(40分钟不到100000条记录,我有数百万条记录在更新中)。 我非常确定有一些内置的东西可以做到这一点,但是 update ()的文档是 mmmhhh..。(http://www.mongodb.org/display/DOCS/Updating)
有人能告诉我怎样做得更快吗?