MongoDB:聚集管道-mysql教程-PHP中文网

首页

数据库

mysql教程

MongoDB:聚集管道

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:59 PM

mongodb管道

在MongoDB2.2新出现的。聚集管道式基于数据处理管道概念建模的数据聚集框架。文档进入一个多阶段能将该文档转化为聚集结果的管道。聚集管道提供了map-reduce方法了替代物，并在很多聚集任务中是首选的方案，因为map-reduce的复杂性可能是你不希望看到的。

在MongoDB2.2新出现的。

聚集管道式基于数据处理管道概念建模的数据聚集框架。文档进入一个多阶段能将该文档转化为聚集结果的管道。

聚集管道提供了map-reduce方法了替代物，并在很多聚集任务中是首选的方案，因为map-reduce的复杂性可能是你不希望看到的。

上图是一个带注释的聚集管道的操作，有两个阶段：$match和$group

聚集管道在值的类型和结果大小上有很多限制。下面简单介绍，

聚集操作在使用aggregate命令时有的限制：

类型限制

聚集管道不是在下列类型的值上进行操作：Symbol,Minkey,MaxKey,DBRef,Code和CodeWSrope

（在MongoDB2.4版本解除了对Binary类型的限制。在MongoDB2.2,管道不能对Binary类型数据操作）

结果大小限制

如果aggregate命令返回的单个文档保护完整的结果集，则该命令在结果集超过BSON Document Size限制时会产生一个错误，目前的大小是16M。为了管理超过这一限制的结果集，aggregate命令当命令返回一个游标(cursor)或把结果保存在一个collection里时，能够返回任意大小的结果集。

（在MongoDB2.6,aggregate命令返回一个游标或把结果存在一个collection时，能不受这个大小限制。db.collection.aggregate()返回一个游标，能返回任意大小的结果集。）

内存限制

在MongoDB2.6有了变化。

管道阶段在RAM有100M的限制。如果超过这一限制，MongoDB会出错。为了允许操作大型数据，可以使用allowDiskUse选项来时聚集管道阶段能往临时文件写数据。

管道

管道，顾名思义就是来自集合的文档通过一个聚集管道的旅行，当通过其中时该管道能转化这些对象。对熟悉Unix shells命令的(如 bash)，这个概念和管道(pipe)很类似。

MongoDB的聚集管道以一个集合的文档开始，流动文档从一个管道操作（pipeline operator）到下一个来处理文档。在管道的每一个操作符在文档经过管道时都会转化文档。管道操作符不需要为每一个输入文档产生一个输出文档。操作符可以产生新文档也能过滤文档。管道操作能在一个管道里面重复。

管道表达式

每一个管道操作符接受一个管道表达式作为操作数。管道表达式指出应用在输入文档的转化过程。表达式有一个文档(document)结构，并包含字段，值和操作符。

管道表达式只能操作在管道中的当前文档，不能引用在其他文档的数据：表达式提供了内存（in-memory)文档转化。

一般的，表达式是无状态的，只在聚集过程时有一个例外：Accumulation expressions。累加表达式，使用$group管道，维持他们的状态（如，totals,maximums,mininums和相关数据）作为通过管道的文档过程。

聚集管道行为

在MongoDB，aggregate命令操作单个集合，并在逻辑上传递整个文档给聚集管道。为了优化这个操作，在可能的情况下，应该使用下面策略来避免扫描整个集合。

管道操作符和索引

$match和$sort管道操作符能够利用索引的优势，如果他们在管道的开始位置出现。

(在Mongo2.4新出现的：$geoNear管道操作符能利用地理索引的优势。当使用$geoNear，$geoNear必须在聚集管道的第一阶段出现。）

即使管道使用了索引，聚合操作依然要访问实际的文档。比如，索引不能完全覆盖聚集管道。

（在Mongo2.6之前的版本，对规模非常小的选择情况，索引能够覆盖管道）

提前过滤

如果你的聚集应用仅需要一个集合的一个数据子集，使用 $match，$limit，$skip阶段在文档进入管道时去限制文档．当被放置在管道的开始，$match操作符使用合适的索引去扫描集合匹配的文档．

在管道的开始紧跟着$sort阶段放置$match在逻辑上等价于一个使用排序的单一查询，并可以使用索引．如果可能的话，把$match放置在管道的开头．

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

MySQL中的存储过程是什么？May 01, 2025 am 12:27 AM

存储过程是MySQL中的预编译SQL语句集合，用于提高性能和简化复杂操作。1.提高性能：首次编译后，后续调用无需重新编译。2.提高安全性：通过权限控制限制数据表访问。3.简化复杂操作：将多条SQL语句组合，简化应用层逻辑。

查询缓存如何在MySQL中工作？May 01, 2025 am 12:26 AM

MySQL查询缓存的工作原理是通过存储SELECT查询的结果，当相同查询再次执行时，直接返回缓存结果。1）查询缓存提高数据库读取性能，通过哈希值查找缓存结果。2）配置简单，在MySQL配置文件中设置query_cache_type和query_cache_size。3）使用SQL_NO_CACHE关键字可以禁用特定查询的缓存。4）在高频更新环境中，查询缓存可能导致性能瓶颈，需通过监控和调整参数优化使用。

与其他关系数据库相比，使用MySQL的优点是什么？May 01, 2025 am 12:18 AM

MySQL被广泛应用于各种项目中的原因包括：1.高性能与可扩展性，支持多种存储引擎；2.易于使用和维护，配置简单且工具丰富；3.丰富的生态系统，吸引大量社区和第三方工具支持；4.跨平台支持，适用于多种操作系统。

您如何处理MySQL中的数据库升级？Apr 30, 2025 am 12:28 AM

MySQL数据库升级的步骤包括：1.备份数据库，2.停止当前MySQL服务，3.安装新版本MySQL，4.启动新版本MySQL服务，5.恢复数据库。升级过程需注意兼容性问题，并可使用高级工具如PerconaToolkit进行测试和优化。

您可以使用MySQL的不同备份策略是什么？Apr 30, 2025 am 12:28 AM

MySQL备份策略包括逻辑备份、物理备份、增量备份、基于复制的备份和云备份。1.逻辑备份使用mysqldump导出数据库结构和数据，适合小型数据库和版本迁移。2.物理备份通过复制数据文件，速度快且全面，但需数据库一致性。3.增量备份利用二进制日志记录变化，适用于大型数据库。4.基于复制的备份通过从服务器备份，减少对生产系统的影响。5.云备份如AmazonRDS提供自动化解决方案，但成本和控制需考虑。选择策略时应考虑数据库大小、停机容忍度、恢复时间和恢复点目标。

什么是mySQL聚类？Apr 30, 2025 am 12:28 AM

MySQLclusteringenhancesdatabaserobustnessandscalabilitybydistributingdataacrossmultiplenodes.ItusestheNDBenginefordatareplicationandfaulttolerance,ensuringhighavailability.Setupinvolvesconfiguringmanagement,data,andSQLnodes,withcarefulmonitoringandpe

如何优化数据库架构设计以在MySQL中的性能？Apr 30, 2025 am 12:27 AM

在MySQL中优化数据库模式设计可通过以下步骤提升性能：1.索引优化：在常用查询列上创建索引，平衡查询和插入更新的开销。2.表结构优化：通过规范化或反规范化减少数据冗余，提高访问效率。3.数据类型选择：使用合适的数据类型，如INT替代VARCHAR，减少存储空间。4.分区和分表：对于大数据量，使用分区和分表分散数据，提升查询和维护效率。

您如何优化MySQL性能？Apr 30, 2025 am 12:26 AM

tooptimizemysqlperformance，lofterTheSeSteps：1）inasemproperIndexingTospeedUpqueries，2）使用ExplaintplaintoAnalyzeandoptimizequeryPerformance，3）ActiveServerConfigurationStersLikeTlikeTlikeTlikeIkeLikeIkeIkeLikeIkeLikeIkeLikeIkeLikeNodb_buffer_pool_sizizeandmax_connections，4）

See all articles