MongoDB指南7find简介与查询条件

共计 4253 个字符，预计需要花费 11 分钟才能阅读完成。

上一篇文章：MongoDB 指南 —6、更新文档
下一篇文章：

本章将详细介绍查询。主要会涵盖以下几个方面：

使用 find 或者 findOne 函数和查询文档对数据库执行查询；
使用 $ 条件查询实现范围查询、数据集包含查询、不等式查询，以及其他一些查询；
查询将会返回一个数据库游标，游标只会在你需要时才将需要的文档批量返回；
还有很多针对游标执行的元操作，包括忽略一定数量的结果，或者限定返回结果的数量，以及对结果排序。

MongoDB 中使用 find 来进行查询。查询就是返回一个集合中文档的子集，子集合的范围从 0 个文档到整个集合。find 的第一个参数决定了要返回哪些文档，这个参数是一个文档，用于指定查询条件。
空的查询文档（例如{}）会匹配集合的全部内容。要是不指定查询文档，默认就是{}。例如：

> db.c.find()

将批量返回集合 c 中的所有文档。
开始向查询文档中添加键 / 值对时，就意味着限定了查询条件。对于绝大多数类型来说，这种方式很简单明了。数值匹配数值，布尔类型匹配布尔类型，字符串匹配字符串。查询简单的类型，只要指定想要查找的值就好了，十分简单。例如，想要查找 ”age” 值为 27 的所有文档，直接将这样的键 / 值对写进查询文档就好了：

> db.users.find({"age" : 27})

要是想匹配一个字符串，比如值为 ”joe” 的 ”username” 键，那么直接将键 / 值对写在查询文档中即可：

> db.users.find({"username" : "joe"})

可以向查询文档加入多个键 / 值对，将多个查询条件组合在一起，这样的查询条件会被解释成“条件 1AND 条件 2AND … AND 条件 N”。例如，要想查询所有用户名为 joe 且年龄为 27 岁的用户，可以像下面这样:

> db.users.find({"username" : "joe", "age" : 27})

有时并不需要将文档中所有键 / 值对都返回。遇到这种情况，可以通过 find（或者 findOne）的第二个参数来指定想要的键。这样做既会节省传输的数据量，又能节省客户端解码文档的时间和内存消耗。
例如，如果只对用户集合的 ”username” 和 ”email” 键感兴趣，可以使用如下查询返回这些键：

> db.users.find({}, {"username" : 1, "email" : 1})
{"_id" : ObjectId("4ba0f0dfd22aa494fd523620"),
    "username" : "joe",
    "email" : "joe@example.com"
}

可以看到，默认情况下 ”_id” 这个键总是被返回，即便是没有指定要返回这个键。
也可以用第二个参数来剔除查询结果中的某些键 / 值对。例如，文档中有很多键，但是我们不希望结果中含有 ”fatal_weakness” 键：

> db.users.find({}, {"fatal_weakness" : 0})

使用这种方式，也可以把 ”_id” 键剔除掉：

> db.users.find({}, {"username" : 1, "_id" : 0})
{"username" : "joe",}

查询的使用上有些限制。传递给数据库的查询文档的值必须是常量。（在你自己的代码里可以是正常的变量。）也就是不能引用文档中其他键的值。例如，要想保持库存，有 ”in_stock”（剩余库存）和 ”num_sold”（已出售）两个键，想通过下列查询来比较两者的值是行不通的：

 > db.stock.find({"in_stock" : "this.num_sold"}) // 这样是行不通的

的确有办法实现类似的操作（详见 4.4 节），但通常需要略微修改一下文档结构，就能通过普通查询来完成这样的操作了，这种方式性能更好。在这个例子中，可以在文档中使用 ”initial_stock”（初始库存）和 ”in_stock” 两个键。这样，每当有人购买物品，就将 ”in_stock” 减去 1。这样，只需要用一个简单的查询就能知道哪种商品已脱销：

> db.stock.find({"in_stock" : 0})

查询不仅能像前面说的那样精确匹配，还能匹配更加复杂的条件，比如范围、OR 子句和取反。

“$lt”、”$lte”、”$gt” 和 ”$gte” 就是全部的比较操作符，分别对应 <、<=、> 和 >=。可以将其组合起来以便查找一个范围的值。例如，查询 18~30 岁（含）的用户，就可以像下面这样：

> db.users.find({"age" : {"$gte" : 18, "$lte" : 30}})

这样就可以查找到 ”age” 字段大于等于 18、小于等于 30 的所有文档。
这样的范围查询对日期尤为有用。例如，要查找在 2007 年 1 月 1 日前注册的人，可以像下面这样：

> start = new Date("01/01/2007")
> db.users.find({"registered" : {"$lt" : start}})

可以对日期进行精确匹配，但是用处不大，因为文档中的日期是精确到毫秒的。而我们通常是想得到一天、一周或者是一个月的数据，这样的话，使用范围查询就很有必要了。
对于文档的键值不等于某个特定值的情况，就要使用另外一种条件操作符 ”$ne” 了，它表示“不相等”。若是想要查询所有名字不为 joe 的用户，可以像下面这样查询：

> db.users.find({"username" : {"$ne" : "joe"}})

“$ne” 能用于所有类型的数据。

MongoDB 中有两种方式进行 OR 查询：”$in” 可以用来查询一个键的多个值；”$or” 更通用一些，可以在多个键中查询任意的给定值。
如果一个键需要与多个值进行匹配的话，就要用 ”$in” 操作符，再加一个条件数组。例如，抽奖活动的中奖号码是 725、542 和 390。要找出全部的中奖文档的话，可以构建如下查询：

> db.raffle.find({"ticket_no" : {"$in" : [725, 542, 390]}})

“$in” 非常灵活，可以指定不同类型的条件和值。例如，在逐步将用户的 ID 号迁移成用户名的过程中，查询时需要同时匹配 ID 和用户名：

> db.users.find({"user_id" : {"$in" : [12345, "joe"]})

这会匹配 ”user_id” 等于 12345 的文档，也会匹配 ”user_id” 等于 ”joe” 的文档。
要是 ”$in” 对应的数组只有一个值，那么和直接匹配这个值效果一样。例如，{ticket_no : {$in:[725]}}和 {ticket_no : 725} 的效果一样。
与 ”$in” 相对的是 ”$nin”，”$nin” 将返回与数组中所有条件都不匹配的文档。要是想返回所有没有中奖的人，就可以用如下方法进行查询：

> db.raffle.find({"ticket_no" : {"$nin" : [725, 542, 390]}})

该查询会返回所有没有中奖的人。
“$in” 能对单个键做 OR 查询，但要是想找到 ”ticket_no” 为 725 或者 ”winner” 为 true 的文档该怎么办呢？对于这种情况，应该使用 ”$or”。”$or” 接受一个包含所有可能条件的数组作为参数。上面中奖的例子如果用 ”$or” 改写将是下面这个样子：

> db.raffle.find({"$or" : [{"ticket_no" : 725}, {"winner" : true}]})

“$or” 可以包含其他条件。例如，如果希望匹配到中奖的 ”ticket_no”，或者 ”winner” 键的值为 true 的文档，就可以这么做：

> db.raffle.find({"$or" : [{"ticket_no" : {"$in" : [725, 542, 390]}},
                           {"winner" : true}]})

使用普通的 AND 型查询时，总是希望尽可能用最少的条件来限定结果的范围。OR 型查询正相反：第一个条件应该尽可能匹配更多的文档，这样才是最为高效的。
“$or” 在任何情况下都会正常工作。如果查询优化器可以更高效地处理 ”$in”，那就选择使用它。

“$not” 是元条件句，即可以用在任何其他条件之上。就拿取模运算符 ”$mod” 来说。”$mod” 会将查询的值除以第一个给定值，若余数等于第二个给定值则匹配成功:

> db.users.find({"id_num" : {"$mod" : [5, 1]}})

上面的查询会返回 ”id_num” 值为 1、6、11、16 等的用户。但要是想返回 ”id_num” 为 2、3、4、5、7、8、9、10、12 等的用户，就要用 ”$not” 了：

> db.users.find({"id_num" : {"$not" : {"$mod" : [5, 1]}}})

“$not” 与正则表达式联合使用时极为有用，用来查找那些与特定模式不匹配的文档（4.3.2 节会详细讲述正则表达式的使用）。

如果比较一下上一章的更新修改器和前面的查询文档，会发现以 $ 开头的键位于在不同的位置。在查询中，”$lt” 在内层文档，而更新中 ”$inc” 则是外层文档的键。基本可以肯定：条件语句是内层文档的键，而修改器则是外层文档的键。
可以对一个键应用多个条件。例如，要查找年龄为 20~30 的所有用户，可以在 ”age” 键上使用 ”$gt” 和 ”$lt”：

> db.users.find({"age" : {"$lt" : 30, "$gt" : 20}})

一个键可以有任意多个条件，但是一个键不能对应多个更新修改器。例如，修改器文档不能同时含有 {“$inc” : {“age” : 1}, “$set” : {age : 40}}，因为修改了 ”age” 两次。但是对于查询条件句就没有这种限定。
有一些“元操作符”（meta-operator）也位于外层文档中，比如 ”$and”、”$or” 和 ”$nor”。它们的使用形式类似：

> db.users.find({"$and" : [{"x" : {"$lt" : 1}}, {"x" : 4}]})

这个查询会匹配那些 ”x” 字段的值小于等于 1 并且等于 4 的文档。虽然这两个条件看起来是矛盾的，但是这是完全有可能的，比如，如果 ”x” 字段的值是这样一个数组{“x” : [0, 4]}，那么这个文档就与查询条件相匹配。注意，查询优化器不会对 ”$and” 进行优化，这与其他操作符不同。如果把上面的查询改成下面这样，效率会更高：

> db.users.find({"x" : {"$lt" : 1, "$in" : [4]}})

4.1 find 简介

4.1.1 指定需要返回的键

4.1.2 限制

4.2 查询条件

4.2.1 查询条件

4.2.2 OR 查询

4.2.3 $not

4.2.4 条件语义

Just My Socks（注册教程内含优惠码）