大家都知道,mongodb是一个非关系型数据库,也就是说,mongodb数据库中的每张表是独立存在的,表与表之间没有任何依赖关系。在mongodb中,除了各种CRUD语句之外,还给我们提供了聚合和mapreduce统计的功能,这篇文章主要来跟大家聊聊mongodb的mapreduce的操
大家都知道,mongodb是一个非关系型数据库,也就是说,mongodb数据库中的每张表是独立存在的,表与表之间没有任何依赖关系。在mongodb中,除了各种CRUD语句之外,还给我们提供了聚合和mapreduce统计的功能,这篇文章主要来跟大家聊聊mongodb的mapreduce的操作。
mapreduce的概念我就不赘述了,大家自己去查查吧。
在mongodb中,mapreduce的语法如下:
db.table.mapReduce( map, reduce, { query: query, out: out, //指定结果集以什么方式存储,可选参数包括: //replace:如果文档(table)存在,则替换table, //merge:如果文档中存在记录,则覆盖已存在的文档记录 //reduce: 如果文档中存在相同key的记录了,则先计算两条记录,然后覆盖旧记录 // {inline:1} 在内存中存储记录,不写入磁盘(用户数据量少的计算) sort: sort, limit: limit, finalize: function //这个function主要用来在存入out之前可以修改数据,function(key,values) { //return modifiedValues;} scope: document, //指定reduce可访问的文档范围 jsMode:boolean //指定是否在map和ruduce之间立即将数据转换为Bason格式,默认为false //如果想设置为true,则要记住官方我那当的注意事项: //You can only use jsMode for result sets with fewer than //500,000 distinct key arguments to the mapper’s emit()function. verbose:boolean //是否在结果集中包含timing信息,默认是包含的 } )
在做mongodb的mapreduce时,要确保你的query是可以利用到索引的,不然在大数据量的统计下,将会托夸整个数据库,如果确实没办法建索引,那么就在结果集中判断一些不符合条件的数据,而去掉query。
mapreduce的语法其实很简单,只不过这里面有几点需要注意一下:
1.在map中,mongodb是每1000条数据就reduce一次
2.在map中,如果你想统计一个数据之和,需要这样写:
emit(key:this.key,sum:0})
然后再在reduce里需要将上一次的sum迭代累加起来,然后return {sum:sum};如果不这样做,你计算出来的数据总是最后不足1000条数据之后统计出来的,而前面的数据就都丢失了。
3.如果能不用mapreduce,就不用,程序能够统计的,就不要用mongodb频繁统计。
4.mapreduce的结果集的数据格式是:{_id:key,value:{}},因此如果想直接使用这个表的话,最好再重新将数据格式整理一次,尽量将数据放在最上次,而不是再用value.xxx去查询。
这里附上统计我们网站的用户发表内容的数量的mapreduce,仅供一种代码格式的参考价值吧:
var db = connect('127.0.0.1:27017/test'); db.aAccounttemp.drop(); var map = function() { emit(this.accountId, {sum:0, reblogFlag:this.reblogFlag,dashboardFlag:this.dashboardFlag,dashboardType:this.dashboardType, photoNum:0,postNum:0,reblogNum:0,videoNum:0,videoShortNum:0, musicNum:0, questionNum:0,appNum:0, dialogNum:0}); } var reduce = function(key,values) { var sum = 0; var photoNum = 0; var postNum = 0; var reblogNum = 0; var videoNum = 0; var videoShortNum = 0; var musicNum = 0; var questionNum = 0; var appNum = 0; var dialogNum = 0; for (var i = 0; i < values.length; i++) { var data = values[i]; var reblogFlag = data.reblogFlag; var dashboardFlag = data.dashboardFlag; var dashboardType = data.dashboardType; sum += data.sum; photoNum += data.photoNum; reblogNum += data.reblogNum; postNum += data.postNum; videoNum += data.videoNum; musicNum += data.musicNum; videoShortNum += data.videoShortNum; questionNum += data.questionNum; appNum += data.appNum; dialogNum += data.dialogNum; if(!reblogFlag) { if(dashboardFlag) { sum += 1; if(dashboardType == 10) { postNum += 1; } else if(dashboardType == 20) { photoNum += 1; } else if(dashboardType == 30) { videoNum += 1; } else if(dashboardType == 31) { videoShortNum += 1; } else if(dashboardType == 40) { musicNum += 1; } else if(dashboardType == 60) { questionNum += 1; } else if(dashboardType == 100) { appNum += 1; } else if(dashboardType == 91) { dialogNum += 1; } } else { if(dashboardType == 20) { photoNum += 1; } } } else if(reblogFlag && dashboardFlag) { reblogNum += 1; } } return {sum:NumberInt(sum),reblogNum:NumberInt(reblogNum),postNum:NumberInt(postNum),photoNum:NumberInt(photoNum), videoNum:NumberInt(videoNum),videoShortNum:NumberInt(videoShortNum), musicNum:NumberInt(musicNum), questionNum:NumberInt(questionNum),appNum:NumberInt(appNum),dialogNum:NumberInt(dialogNum)}; }; db.getMongo().setSlaveOk(); db.dashboard_basic.mapReduce( map, reduce, { out:{merge:'aAccounttemp'} } ); var results = db.aAccounttemp.find(); //重新整理数据格式,存入正规表中 while (results.hasNext()) { var obj = results.next(); var value = obj.value; var sum = NumberInt(value.sum); var reblogNum = NumberInt(value.reblogNum); var postNum = NumberInt(value.postNum); var photoNum = NumberInt(value.photoNum); var videoNum = NumberInt(value.videoNum); var videoShortNum = NumberInt(value.videoShortNum); var musicNum = NumberInt(value.musicNum); var questionNum = NumberInt(value.questionNum); var appNum = NumberInt(value.appNum); var dialogNum = NumberInt(value.dialogNum); var accountId = obj._id; db.dashboard_account_num.insert({accountId:accountId,sum:sum,reblogNum:reblogNum,postNum:postNum,photoNum:photoNum, videoShortNum:videoShortNum,videoNum:videoNum,musicNum:musicNum,questionNum:questionNum, appNum:appNum,dialogNum:dialogNum}); } print('success insert total ' + results.count()+ ' datas'); db.aAccounttemp.drop() quit()

命名管道是一种在操作系统中相对比较低级的进程通信方式,它是一种以文件为中介的进程通信方式。在Go语言中,通过os包提供了对命名管道的支持。在本文中,我们将介绍如何在Go中使用命名管道来实现进程间通信。一、命名管道的概念命名管道是一种特殊的文件,可以被多个进程同时访问。在Linux系统中,命名管道是一种特殊的文件类型,它们存在于文件系统的某个位置上,并且可以在

在Go语言中,使用第三方库是非常方便的。许多优秀的第三方库和框架可以帮助我们快速地开发应用程序,同时也减少了我们自己编写代码的工作量。但是如何正确地使用第三方库,确保其稳定性和可靠性,是我们必须了解的一个问题。本文将从以下几个方面介绍如何使用第三方库,并结合具体例子进行讲解。一、第三方库的获取Go语言中获取第三方库有以下两种方式:1.使用goget命令首先

随着传统的多线程模型在高并发场景下的性能瓶颈,协程成为了PHP编程领域的热门话题。协程是一种轻量级的线程,能够在单线程中实现多任务的并发执行。在PHP的语言生态中,协程得到了广泛的应用,比如Swoole、Workerman等框架就提供了对协程的支持。那么,如何在PHP中使用协程呢?本文将介绍一些基本的使用方法以及常见的注意事项,帮助读者了解协程的运作原理,以

数据聚合函数是一种用于处理数据库表中多行数据的函数。在PHP中使用数据聚合函数可以使得我们方便地进行数据分析和处理,例如求和、平均数、最大值、最小值等。下面将介绍如何在PHP中使用数据聚合函数。一、介绍常用的数据聚合函数COUNT():计算某一列的行数。SUM():计算某一列的总和。AVG():计算某一列的平均值。MAX():取出某一列的最大值。MIN():

变量函数是指可以使用变量来调用函数的一种特殊语法。在PHP中,变量函数是非常有用的,因为它可以让我们更加灵活地使用函数。在本文中,我们将介绍如何在PHP中使用变量函数。定义变量函数在PHP中,变量函数的定义方式非常简单,只需要将要调用的函数名赋值给一个变量即可。例如,下面的代码定义了一个变量函数:$func='var_dump';这里将var_dump函

随着音频处理在各种应用场景中的普及,越来越多的程序员开始使用Go编写音频处理程序。Go语言作为一种现代化的编程语言,具有优秀的并发性和高效率的特点,使用它进行音频处理十分方便。本文将介绍如何在Go中使用音频处理技术,包括读取、写入、处理和分析音频数据等方面的内容。一、读取音频数据在Go中读取音频数据有多种方式。其中比较常用的是使用第三方库进行读取,比如go-

在Go语言中,嵌套结构是一种非常常见的技术。通过将一个结构体嵌入到另一个结构体中,我们可以将复杂的数据模型分解成更小的部分,使其易于理解和维护。本篇文章将介绍如何在Go中使用嵌套结构以及一些最佳实践。一、定义嵌套结构首先,我们需要定义一个包含嵌套结构的结构体。下面的代码演示了如何定义一个包含Person结构体的Company结构体:typePersons

近年来,WebSocket技术已经成为了Web开发中不可或缺的一部分。WebSocket是一种在单个TCP连接上进行全双工通信的协议,它使得客户端和服务器之间的通信更加流畅和高效。如今,很多现代的Web应用程序都使用了WebSocket技术,例如实时聊天、在线游戏以及实时数据可视化等。Go语言作为一个现代的编程语言,自然也提供了很好的支持WebSock


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

SublimeText3汉化版
中文版,非常好用

WebStorm Mac版
好用的JavaScript开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

SublimeText3 Linux新版
SublimeText3 Linux最新版