MongoDB与mapreduce

Mongodb可以实现MapReduce,用于完成count,distinct,group by等聚合函数的功能,此外还有其他功能。

MapReduce开始是将操作映射到mongodb集合中的每一个文档,这个操作要么什么都不做,要么产生一些键和N个值,然后按照键分组,将相同键对应值的值组成列表,放到对应的键的值中。最后进行化简,把键对应的列表中的值化简成一个单一的值。这个值被返回,接着进行洗牌,直到每个键的列表只有一个值为止,这个值也就是最后结果。

mongodb中map函数通过emit返回要处理的值。

例如:

map = function(){

    for(var key in this){

       emit(key,{count:1});

   }

}

 this就是当前映射文档的引用。

reduce = function(key,emits){

    total = 0;

    for(var i in emits){

       total += emits[i].count;

    }

       return {"count":total}

}

上述示例实现了常见的wordcount

调用如下:

mr = db.runCommand({"mapreduce":"foo","map":map,"reduce":reduce})

相关推荐