この記事では、MongoDB インデックスの使用方法について詳しく説明します。インデックスは本の目次のようなもので、目次を使用せずに特定のコンテンツを検索することしかできません。記事全体を検索して参照すると、効率が非常に低くなります。目次を使用すると、特定のコンテンツが含まれる領域をすぐに見つけることができ、効率が直線的に向上します。
インデックス作成の概要
まずコマンドラインを開いて「mongo」と入力します。デフォルトでは、mongodb は test という名前のデータベースに接続します。
➜ ~ mongo
MongoDB shell version: 2.4.9 connecting to: test > show collections >
show collections/tables を使用して、データベースが空であることを確認できます。
次に、mongodb コマンドラインターミナルで次のコードを実行します
> for(var i=0;i<100000;i++) { ... db.users.insert({username:'user'+i}) ... } > show collections system.indexes users >
次に、データベースをチェックして、さらに system.index と
ユーザー用のテーブルは 2 つあり、前者はいわゆるインデックス、後者は新しく作成されたデータベース テーブルです。
このように、userテーブルには100,000個のデータがあります。
> db.users.find() { "_id" : ObjectId("5694d5da8fad9e319c5b43e4"), "username" : "user0" } { "_id" : ObjectId("5694d5da8fad9e319c5b43e5"), "username" : "user1" } { "_id" : ObjectId("5694d5da8fad9e319c5b43e6"), "username" : "user2" } { "_id" : ObjectId("5694d5da8fad9e319c5b43e7"), "username" : "user3" } { "_id" : ObjectId("5694d5da8fad9e319c5b43e8"), "username" : "user4" } { "_id" : ObjectId("5694d5da8fad9e319c5b43e9"), "username" : "user5" }
ここで、任意のデータを見つける必要があります。たとえば、
> db.users.find({username: 'user1234'}) { "_id" : ObjectId("5694d5db8fad9e319c5b48b6"), "username" : "user1234" }
はこのデータが正常に見つかったことがわかりましたが、詳細な情報を知る必要があり、Explainメソッドを追加する必要があります
> db.users.find({username: 'user1234'}).explain() { "cursor" : "BasicCursor", "isMultiKey" : false, "n" : 1, "nscannedObjects" : 100000, "nscanned" : 100000, "nscannedObjectsAllPlans" : 100000, "nscannedAllPlans" : 100000, "scanAndOrder" : false, "indexOnly" : false, "nYields" : 0, "nChunkSkips" : 0, "millis" : 30, "indexBounds" : { }, "server" : "root:27017" }
には、多くのパラメータがあります。現在、両方の項目の "nscanned": 100000 と "millis": 30 のみに焦点を当てています。
nscanned は、このクエリの完了中に mongodb によってスキャンされたドキュメントの総数を示します。コレクション内のすべてのドキュメントがスキャンされ、合計時間が 30 ミリ秒であることがわかります。
データが 1,000 万個ある場合、ドキュメントがクエリされるたびにデータが走査されます。まあ、時間もかなりのものです。
このようなクエリの場合、インデックス作成は非常に優れたソリューションです。
> db.users.ensureIndex({"username": 1})
次に user1234
> db.users.ensureIndex({"username": 1}) > db.users.find({username: 'user1234'}).explain() { "cursor" : "BtreeCursor username_1", "isMultiKey" : false, "n" : 1, "nscannedObjects" : 1, "nscanned" : 1, "nscannedObjectsAllPlans" : 1, "nscannedAllPlans" : 1, "scanAndOrder" : false, "indexOnly" : false, "nYields" : 0, "nChunkSkips" : 0, "millis" : 0, "indexBounds" : { "username" : [ [ "user1234", "user1234" ] ] }, "server" : "root:27017" }
を検索すると、インデックスを通じて 100,000 件のデータではなく 1 つのデータしか見つからないため、クエリは一瞬で完了します。
もちろん、インデックスの使用にはコストがかかります。インデックスが追加されるたびに、各書き込み操作 (挿入、更新、削除) にかかる時間が長くなります。これは、データが変更されると、ドキュメントを更新する必要があるだけでなく、レベル コレクションのすべてのインデックスも更新されるためです。したがって、mongodb は各コレクションを最大 64 個のインデックスに制限します。一般に、特定のコレクションには 2 つを超えるインデックスを作成しないでください。
ヒント
それが非常に一般的なクエリである場合、またはこのクエリがパフォーマンスのボトルネックを引き起こす場合、特定のフィールド (ユーザー名など) にインデックスを作成することは非常に良い選択です。ただし、管理者 (クエリにかかる時間を気にしない) が使用するクエリのみを目的とする場合、このフィールドにはインデックスを作成しないでください。
複合インデックス
インデックスの値は特定の順序で配置されているため、インデックスキーを使用したドキュメントの並べ替えは非常に高速です。
db.users.find().sort({'age': 1, 'username': 1})
ここでは、最初に年齢で並べ替え、次にユーザー名で並べ替えるので、ここではユーザー名は役割を果たしません。 大きい。この並べ替えを最適化するには、年齢とユーザー名に関するインデックスを作成する必要がある場合があります。
db.users.ensureIndex({'年齢':1, 'ユーザー名':
1})
これにより、複合インデックス (複数のフィールドに構築されたインデックス) が作成されます。これは、クエリ条件に複数のキーが含まれる場合に非常に便利です。
複合インデックスが確立されると、各インデックス エントリには年齢フィールドとユーザー名フィールドが含まれ、ディスク上のドキュメントの保存場所を指します。
現時点では、年齢フィールドは厳密に昇順に配置されています。年齢が等しい場合は、ユーザー名の昇順に配置されます。
Queryメソッド
Pointクエリ
は、単一の値をクエリするために使用されます(ただし、この値を含む複数のドキュメントが存在する可能性があります)
db.users.find({'age': 21}).sort( {'username ': -1})
1 つの年齢と 1 つのユーザー名という複合インデックスがすでに確立されているため、インデックスを確立するときに、ポイント クエリを使用して {age: を検索するときに昇順 (つまり、番号 1) を使用します。 21 }, データがまだ 100,000 件あると仮定すると、21 歳の人はたくさんいると考えられるため、複数のデータが見つかります。次に、sort({'ユーザー名': -1}) は、本来の目的どおり、これらのデータを逆順に並べ替えます。ただし、インデックスを作成するときは「ユーザー名」を忘れないでください。1 は昇順 (小さいものから大きいものへ) です。逆の順序を取得したい場合は、データの最後のインデックスから開始して目的のインデックスを取得するだけです。結果。
ソート方向は関係ありません。mongodb はどの方向からでもインデックスを走査できます。
要約すると、複合インデックスはポイント クエリにおいて非常に効率的であり、結果を並べ替えて結果を返す必要がありません。
複数値クエリ (multi-value-query)
db.users.find({'age': {"$gte": 21, "$lte": 30}})
複数を検索値が一致するドキュメント。複数値クエリは、複数ポイント クエリとして理解することもできます。
上記と同様に、21 歳から 30 歳までの年齢を見つけたいとします。 monogdb は、インデックス内の最初のキー「age」を使用して一致する結果を取得します。結果は通常、インデックス順に並べられます。
db.users.find({'年齢': {"$gte": 21, "$lte": 30}}).sort({'ユーザー名': 1})
与上一个类似,这次需要对结果排序。
在没有sort时,我们查询的结果首先是根据age等于21,age等于22..这样从小到大排序,当age等于21有多个时,在进行usernameA-Z(0-9)这样排序。所以,sort({'username':
1}),要将所有结果通过名字升序排列,这次不得不先在内存中进行排序,然后返回。效率不如上一个高。
当然,在文档非常少的情况,排序也花费不了多少时间。
如果结果集很大,比如超过32MB,MongoDB会拒绝对如此多的数据进行排序工作。
还有另外一种解决方案
也可以建立另外一个索引{'username': 1, 'age': 1}, 如果先对username建立索引,当再sortusername,相当没有进行排序。但是需要在整个文档查找age等于21的帅哥美女,所以搜寻时间就长了。
但哪个效率更高呢?
如果建立多个索引,如何选择使用哪个呢?
效率高低是分情况的,如果在没有限制的情况下,不用进行排序但需要搜索整个集合时间会远超过前者。但是在返回部分数据(比如limit(1000)),新的赢家就产生了。
>db.users.find({'age': {"$gte": 21, "$lte": 30}}). sort({username': 1}). limit(1000). hint({'age': 1, 'username': 1}) explain()['millis'] 2031ms >db.users.find({'age': {"$gte": 21, "$lte": 30}}). sort({username': 1}). limit(1000). hint({'username': 1, 'age': 1}). explain()['millis'] 181ms
其中可以使用hint指定要使用的索引。
所以这种方式还是很有优势的。比如一般场景下,我们不会把所有的数据都取出来,只是去查询最近的,所以这种效率也会更高。
索引类型
唯一索引
可以确保集合的每个文档的指定键都有唯一值。
db.users.ensureIndex({'username': 1, unique: true})
比如使用mongoose框架,在定义schema时,即可指定unique:
true.
如果插入2个相同都叫张三的数据,第二次插入的则会失败。_id即为唯一索引,并且不能删除。
稀疏索引
使用sparse可以创建稀疏索引
>db.users.ensureIndex({'email': 1}, {'unique': true, 'sparse': true})
索引管理
system.indexes集合中包含了每个索引的详细信息
db.system.indexes.find()
1.ensureIndex()创建索引
db.users.ensureIndex({'username': 1})
后台创建索引,这样数据库再创建索引的同时,仍然能够处理读写请求,可以指定background选项。
db.test.ensureIndex({"username":1},{"background":true})
2.getIndexes()查看索引
db.collectionName.getIndexes() db.users.getIndexes() [ { "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.users", "name" : "_id_" }, { "v" : 1, "key" : { "username" : 1 }, "ns" : "test.users", "name" : "username_1" } ]
其中v字段只在内部使用,用于标识索引版本。
3.dropIndex删除索引
> db.users.dropIndex("username_1") { "nIndexesWas" : 2, "ok" : 1 }
或
全选复制放进笔记> db.users.dropIndex({"username":1})
以上内容就是MongoDB索引的使用详解,希望对大家有帮助。
相关推荐:
以上がMongoDB インデックスの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。