最近,我们的一个主要集合的记录超过了200万条,现在我们开始为该集合的主要性能问题而苦恼。
集合中的文档有大约8个字段,您可以使用 UI 进行筛选,并且结果应该按照处理记录的时间戳字段进行排序。
我已经添加了几个带有筛选字段和时间戳的复合索引 例如:
db.events.ensureIndex({somefield: 1, timestamp:-1})
我还添加了两个索引,用于同时使用多个过滤器,以期获得更好的性能。但有些过滤器仍然需要很长的时间才能运行。
我已经确保使用解释,说明查询确实使用了我创建的索引,但是性能仍然不够好。
I was wondering if sharding is the way to go now.. but we will soon start to have about 1 million new records per day in that collection.. so I'm not sure if it will scale well..
编辑: 查询的例子:
> db.audit.find({'userAgent.deviceType': 'MOBILE', 'user.userName': {$in: ['nickey@acme.com']}}).sort({timestamp: -1}).limit(25).explain()
{
"cursor" : "BtreeCursor user.userName_1_timestamp_-1",
"isMultiKey" : false,
"n" : 0,
"nscannedObjects" : 30060,
"nscanned" : 30060,
"nscannedObjectsAllPlans" : 120241,
"nscannedAllPlans" : 120241,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 1,
"nChunkSkips" : 0,
"millis" : 26495,
"indexBounds" : {
"user.userName" : [
[
"nickey@acme.com",
"nickey@acme.com"
]
],
"timestamp" : [
[
{
"$maxElement" : 1
},
{
"$minElement" : 1
}
]
]
},
"server" : "yarin:27017"
}
请注意,deviceType 在我的集合中只有2个值。