MongoDB入门学习(四)：MongoDB的索引-mysql教程-PHP中文网

首页

数据库

mysql教程

MongoDB入门学习(四)：MongoDB的索引

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:57 PM

mongodb入门学习索引

上一篇讲到了MongoDB的基本操作增删查改，对于查询来说，必须按照我们的查询要求去集合中，并将查找到的结果返回，在这个过程中其实是对整个集合中每个文档进行了扫描，如果满足我们的要求就添加到结果集中最后返回。对于小集合来说，这个过程没什么，但是集

上一篇讲到了MongoDB的基本操作增删查改，对于查询来说，必须按照我们的查询要求去集合中，并将查找到的结果返回，在这个过程中其实是对整个集合中每个文档进行了扫描，如果满足我们的要求就添加到结果集中最后返回。对于小集合来说，这个过程没什么，但是集合中数据很大的时候，进行表扫描是一个非常恐怖的事情，于是有了索引一说，索引是用来加速查询的，相当于书籍的目录，有了目录可以很精准的定位要查找内容的位置，从而减少无谓的查找。

1.索引的类型

创建索引可以是在单个字段上，也可以是在多个字段上，这个根据自己的实际情况来选择，创建索引时字段的顺序也是有讲究的。创建索引是通过ensureIndex()方法，需要给该方法传递一个文档形式的数据，其中指定索引的字段和顺序，1代表升序，-1代表降序。

1).默认索引

还记得"_id"吗，这个字段的数据是不能重复的，它就是MongoDB的默认索引，而且不能被删除。

2).单列索引

在单个字段上创建的索引就是单列索引，在查询的过程中可以对该加速对该键的查询，然而对其他键的查询是没有帮助的。单列索引的顺序是不会影响对该键的随即查询，创建单列索引：

> db.people.ensureIndex({"name" : 1})

3).组合索引

还可以在多个键上创建组合索引，此时键的位置和索引的顺序都会影响查询的效率，看下面创建组合索引：

> db.people.ensureIndex({"name" : 1, "age" : 1})
> db.people.ensureIndex({"age" : 1, "name" : 1})

第一种情况会对name排序组织，当name一样时在对age排序，所以对{"name" : 1}和{“name” : 1, "age" : 1}的查询更高效，而第二种情况则对age排序，当age一样再对name排序，所以对{"age" : 1}和{"age" : 1, "name" : 1}的查询更高效。当组合索引包含很多字段的时候，会对前几个键的查询有帮助。

4).内嵌文档索引

还可以对内嵌文档创建索引，和普通键创建索引一样差不多，也可以对内嵌文档创建组合索引：

> db.people.ensureIndex({"friends.name" : 1})
> db.people.ensureIndex({"friends.name" : 1, "friends.age" : 1})

在来看看其他几种形式的索引：

唯一索引
> db.people.ensureIndex({"name" : 1}, {"unique" : true})
> db.people.ensureIndex({"name" : 1}, {"unique" : true, "dropDups" : true})
松散索引
> db.people.ensureIndex({"name" : 1}, {"sparse" : true})
多值索引
> db.people.find()
{"name" : ["mary", "rose"]}
> db.people.ensureIndex({"name" : 1})

唯一索引unique可以保证该键对应的值在集合中是唯一的，如果创建唯一索引的时候，该字段原来就存在了重复的数据，那么就会创建失败，可以加上dropDups字段来消除重复数据，它会保留发现的第一个文档，其他有重复数据的文档都将被删除。

集合中有的文档不存在某些字段，或者某些字段的值为null，那么我们在该字段上创建索引的时候不希望让这些空值的文档参与，那么就定义为松散索引sparse，比如在name上创建索引时，发现有的人在数据库中只有学号，没有名字，那么我们不希望把它们也包含进来，此时就定义为松散索引。

一个键对应的值是一个数组，在该键上创建索引时是一个多值索引，会为数组中每个值生成一个索引元素，相当于分裂成了几个独立的索引项，但是它们还是对应同一个文档数据。

2.索引的管理

索引固然是为查询而生，而且可以为每个键都创建索引，但是索引是需要存储空间的，所以索引不是越多越好，而且创建索引后，每次的插入，更新和删除文档都会产生额外的开销，因为数据库中不但要执行这些操作，而且还要在集合索引中标记这些操作。所以要根据实际情况来创建索引，索引没用之后将其删除。

创建索引是ensureIndex()方法，创建完成后可以通过getIndexes()来查看集合中创建的索引情况：

> db.people.ensureIndex({"name" : 1, "age" : 1})
> db.people.getIndexes()
[
        {
                "v" : 1,
                "key" : {
                        "_id" : 1
                },
                "ns" : "test.people",
                "name" : "_id_"
        },
        {
                "v" : 1,
                "key" : {
                        "name" : 1,
                        "age" : 1
                },
                "ns" : "test.people",
                "name" : "name_1_age_1"
        }
]

可以看到people集合创建了两个索引，一个是"_id"，这个是默认索引，另外一个是name和age的组合索引，名字为keyname1_dir_keyname2_dir_...，keyname代表索引的键，dir代表方向，1代表升序，-1代表降序。当然我们也可以自定义索引的名称：

> db.people.ensureIndex({"name" : 1, "age" : 1}, {"name" : "myIndex"})
> db.people.getIndexes()
[
        {
                "v" : 1,
                "key" : {
                        "_id" : 1
                },
                "ns" : "test.people",
                "name" : "_id_"
        },
        {
                "v" : 1,
                "key" : {
                        "name" : 1,
                        "age" : 1
                },
                "ns" : "test.people",
                "name" : "myIndex"
        }
]

删除索引是通过dropIndex()：

方式一：
> db.people.dropIndex({"name" : 1, "age" : 1})
{ "nIndexesWas" : 2, "ok" : 1 }
方式二：
> db.runCommand({"dropIndexes" : "people", "index" : "myIndex"})
{ "nIndexesWas" : 2, "ok" : 1 }

索引的元信息存储在每个数据库的system.indexes集合中，不能对其进行插入和删除文档的操作，只能通过ensureIndex和dropIndex进行。

> db.system.indexes.find()
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.people", "name" : "_id_" }
{ "v" : 1, "key" : { "name" : 1, "age" : 1 }, "ns" : "test.people", "name" : "myIndex" }

清空集合中所有的文档是不会将索引删除的，原来创建的索引依然存在，但是直接删除集合的话，该集合的索引也是会被删除的。

3.索引的效率

如果我们定义了很多的索引，那么MongoDB会根据我们的查询选项重新排序，并智能的选择一个最优的来使用，比如我们创建了{"name" : 1, "age" : 1}和{"age" : 1, "class" : 1}两个索引，但是我们的查询项为find({"age" : 10, "name" : "mary"})，那么MongoDB会自动重新排序为find({"name" : "mary", "age" : 10})，并且利用索引{"name" : 1, "age" : 1}来查询。

MongoDB提供了explain工具来帮助我们获得查询方面的很多有用信息，只要对游标调用这个方法就可以得到查询的细节。下面给math集合中添加10W个文档，再来看看使用索引前后的效率对比：

> var arr = [];
> for(var i = 0; i < 100000; i++){
... var doc = {};
... var value = Math.floor(Math.random() * 1000);
... doc["number"] = value;
... arr.push(doc);
... }
100000
> db.math.insert(arr)
> db.math.count()
100000
> db.math.find().limit(10)
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fe5"), "number" : 462 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fe6"), "number" : 123 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fe7"), "number" : 90 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fe8"), "number" : 46 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fe9"), "number" : 244 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fea"), "number" : 972 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61feb"), "number" : 925 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fec"), "number" : 110 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fed"), "number" : 739 }
{ "_id" : ObjectId("53a7f7c6e4fd24348ce61fee"), "number" : 945 }

通过for循环给arr数组中添加10W条数据，然后再批量插入这些数据到math集合中，查看前10条数据，因为是随即生成的值，所以number字段的值会有重复值，我们就来查询462这个值：

创建索引前：
> db.math.find({"number" : 462}).explain()
{
        "cursor" : "BasicCursor",
        "isMultiKey" : false,
        "n" : 94,
        "nscannedObjects" : 100000,
        "nscanned" : 100000,
        "nscannedObjectsAllPlans" : 100000,
        "nscannedAllPlans" : 100000,
        "scanAndOrder" : false,
        "indexOnly" : false,
        "nYields" : 0,
        "nChunkSkips" : 0,
        "millis" : 35,
        "indexBounds" : {

        },
        "server" : "server0.169:9352"
}
创建索引后：
> db.math.ensureIndex({"number" : 1})
> db.math.find({"number" : 462}).explain()
{
        "cursor" : "BtreeCursor number_1",
        "isMultiKey" : false,
        "n" : 94,
        "nscannedObjects" : 94,
        "nscanned" : 94,
        "nscannedObjectsAllPlans" : 94,
        "nscannedAllPlans" : 94,
        "scanAndOrder" : false,
        "indexOnly" : false,
        "nYields" : 0,
        "nChunkSkips" : 0,
        "millis" : 0,
        "indexBounds" : {
                "number" : [
                        [
                                462,
                                462
                        ]
                ]
        },
        "server" : "server0.169:9352"
}

这里来看一下有用的信息，"cursor"指用的哪个索引，"nscanned"代表查找了多少个文档，"n"指返回文档的数量，"millis"表示查询所花时间，单位是毫秒。可以看出创建索引前没有使用索引，在全部的文档中查询的，花费了35毫秒，而创建索引后，使用了number_1索引查询，索引存储在B树结构中，只在94个文档中查询，几乎不花时间。

如果有很多索引的话，MongoDB会自动选一个来查询，你也可以通过hint来强制使用某个索引，这里强制使用{"age" : 1, "name" : 1}这个索引：

> db.people.find({"age" : {"$gt" : 10}, "name" : "mary"}).hint({"age" : 1, "name" : 1})

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

MySQL：初学者的基本技能Apr 18, 2025 am 12:24 AM

MySQL适合初学者学习数据库技能。1.安装MySQL服务器和客户端工具。2.理解基本SQL查询，如SELECT。3.掌握数据操作：创建表、插入、更新、删除数据。4.学习高级技巧：子查询和窗口函数。5.调试和优化：检查语法、使用索引、避免SELECT*，并使用LIMIT。

MySQL：结构化数据和关系数据库Apr 18, 2025 am 12:22 AM

MySQL通过表结构和SQL查询高效管理结构化数据，并通过外键实现表间关系。1.创建表时定义数据格式和类型。2.使用外键建立表间关系。3.通过索引和查询优化提高性能。4.定期备份和监控数据库确保数据安全和性能优化。

MySQL：解释的关键功能和功能Apr 18, 2025 am 12:17 AM

MySQL是一个开源的关系型数据库管理系统，广泛应用于Web开发。它的关键特性包括：1.支持多种存储引擎，如InnoDB和MyISAM，适用于不同场景；2.提供主从复制功能，利于负载均衡和数据备份；3.通过查询优化和索引使用提高查询效率。

SQL的目的：与MySQL数据库进行交互Apr 18, 2025 am 12:12 AM

SQL用于与MySQL数据库交互，实现数据的增、删、改、查及数据库设计。1）SQL通过SELECT、INSERT、UPDATE、DELETE语句进行数据操作；2）使用CREATE、ALTER、DROP语句进行数据库设计和管理；3）复杂查询和数据分析通过SQL实现，提升业务决策效率。

初学者的MySQL：开始数据库管理Apr 18, 2025 am 12:10 AM

MySQL的基本操作包括创建数据库、表格，及使用SQL进行数据的CRUD操作。1.创建数据库：CREATEDATABASEmy_first_db;2.创建表格：CREATETABLEbooks(idINTAUTO_INCREMENTPRIMARYKEY,titleVARCHAR(100)NOTNULL,authorVARCHAR(100)NOTNULL,published_yearINT);3.插入数据：INSERTINTObooks(title,author,published_year)VA

MySQL的角色：Web应用程序中的数据库Apr 17, 2025 am 12:23 AM

MySQL在Web应用中的主要作用是存储和管理数据。1.MySQL高效处理用户信息、产品目录和交易记录等数据。2.通过SQL查询，开发者能从数据库提取信息生成动态内容。3.MySQL基于客户端-服务器模型工作，确保查询速度可接受。

mysql：构建您的第一个数据库Apr 17, 2025 am 12:22 AM

构建MySQL数据库的步骤包括：1.创建数据库和表，2.插入数据，3.进行查询。首先，使用CREATEDATABASE和CREATETABLE语句创建数据库和表，然后用INSERTINTO语句插入数据，最后用SELECT语句查询数据。

MySQL：一种对数据存储的初学者友好方法Apr 17, 2025 am 12:21 AM

MySQL适合初学者，因为它易用且功能强大。1.MySQL是关系型数据库，使用SQL进行CRUD操作。2.安装简单，需配置root用户密码。3.使用INSERT、UPDATE、DELETE、SELECT进行数据操作。4.复杂查询可使用ORDERBY、WHERE和JOIN。5.调试需检查语法，使用EXPLAIN分析查询。6.优化建议包括使用索引、选择合适数据类型和良好编程习惯。

See all articles