db.Passages.aggregate([ { $group:{_id:{content:'$content',endTime:'$endTime',startTime:'$startTime'},count:{$sum:1},dups: {$addToSet:'$_id'}} }, { $match:{count:{$gt:1}} } ]).forEach(function(it){ it.dups.shift(); db.Passages.remove({_id: {$in: it.dups}}); });
下面来解析:
1、使用aggregate聚合查询重复数据
·$group中是查询条件,根据content、endTime、startTime字段来聚合相同的数据;
·$count用来统计重复出现的次数, $match来过滤没有重复的数据;
·$addToSet将聚合的数据id放入到dups数组中方便后面使用;
2、查询结果使用forEach进行迭代id来删除数据
·shift()作用是剔除队列中第一条id,避免删掉所有的数据;
PS:注意函数的大小写,mongoDB是严格区分大小写的!!!
python学习网,大量的免费MongoDB入门教程,欢迎在线学习!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)