关于android:Python连接MongoDB服务

MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储模式相似JSON对象，它的字段值能够蕴含其余文档、数组及文档数组，非常灵活。在这一节中，咱们就来看看Python 3下MongoDB的存储操作。

1. 筹备工作

在开始之前，请确保曾经装置好了MongoDB并启动了其服务，并且装置好了Python的PyMongo库。

2. 连贯MongoDB

连贯MongoDB时，咱们须要应用PyMongo库外面的MongoClient。一般来说，传入MongoDB的IP及端口即可，其中第一个参数为地址host，第二个参数为端口port（如果不给它传递参数，默认是27017）：

import pymongo
client = pymongo.MongoClient(host='localhost', port=27017)

这样就能够创立MongoDB的连贯对象了。

另外，MongoClient的第一个参数host还能够间接传入MongoDB的连贯字符串，它以mongodb结尾，例如：

client = MongoClient('mongodb://localhost:27017/')

这也能够达到同样的连贯成果。

3. 指定数据库

MongoDB中能够建设多个数据库，接下来咱们须要指定操作哪个数据库。这里咱们以test数据库为例来阐明，下一步须要在程序中指定要应用的数据库：

db = client.test

这里调用client的test属性即可返回test数据库。当然，咱们也能够这样指定：

db = client['test']

这两种形式是等价的。

4. 指定汇合

MongoDB的每个数据库又蕴含许多汇合（collection），它们相似于关系型数据库中的表。

下一步须要指定要操作的汇合，这里指定一个汇合名称为students。与指定数据库相似，指定汇合也有两种形式：

collection = db.students

collection = db['students']

这样咱们便申明了一个Collection对象。

5. 插入数据

接下来，便能够插入数据了。对于students这个汇合，新建一条学生数据，这条数据以字典模式示意：

student = {
    'id': '20170101',
    'name': 'Jordan',
    'age': 20,
    'gender': 'male'
}

这里指定了学生的学号、姓名、年龄和性别。接下来，间接调用collection的insert()办法即可插入数据，代码如下：

result = collection.insert(student)
print(result)

在MongoDB中，每条数据其实都有一个_id属性来惟一标识。如果没有显式指明该属性，MongoDB会主动产生一个ObjectId类型的_id属性。insert()办法会在执行后返回_id值。

运行后果如下：

5932a68615c2606814c91f3d

当然，咱们也能够同时插入多条数据，只须要以列表模式传递即可，示例如下：

student1 = {
    'id': '20170101',
    'name': 'Jordan',
    'age': 20,
    'gender': 'male'
}

student2 = {
    'id': '20170202',
    'name': 'Mike',
    'age': 21,
    'gender': 'male'
}

result = collection.insert([student1, student2])
print(result)

返回后果是对应的_id的汇合：

[ObjectId('5932a80115c2606a59e8a048'), ObjectId('5932a80115c2606a59e8a049')]

实际上，在PyMongo 3.x版本中，官网曾经不举荐应用insert()办法了。当然，持续应用也没有什么问题。官网举荐应用insert_one()和insert_many()办法来别离插入单条记录和多条记录，示例如下：

student = {
    'id': '20170101',
    'name': 'Jordan',
    'age': 20,
    'gender': 'male'
}

result = collection.insert_one(student)
print(result)
print(result.inserted_id)

运行后果如下：

<pymongo.results.InsertOneResult object at 0x10d68b558>
5932ab0f15c2606f0c1cf6c5

与insert()办法不同，这次返回的是InsertOneResult对象，咱们能够调用其inserted_id属性获取_id。

对于insert_many()办法，咱们能够将数据以列表模式传递，示例如下：

student1 = {
    'id': '20170101',
    'name': 'Jordan',
    'age': 20,
    'gender': 'male'
}

student2 = {
    'id': '20170202',
    'name': 'Mike',
    'age': 21,
    'gender': 'male'
}

result = collection.insert_many([student1, student2])
print(result)
print(result.inserted_ids)

运行后果如下：

<pymongo.results.InsertManyResult object at 0x101dea558>
[ObjectId('5932abf415c2607083d3b2ac'), ObjectId('5932abf415c2607083d3b2ad')]

该办法返回的类型是InsertManyResult，调用inserted_ids属性能够获取插入数据的_id列表。

6. 查问

插入数据后，咱们能够利用find_one()或find()办法进行查问，其中find_one()查问失去的是单个后果，find()则返回一个生成器对象。示例如下：

result = collection.find_one({'name': 'Mike'})
print(type(result))
print(result)

这里咱们查问name为Mike的数据，它的返回后果是字典类型，运行后果如下：

<class 'dict'>
{'_id': ObjectId('5932a80115c2606a59e8a049'), 'id': '20170202', 'name': 'Mike', 'age': 21, 'gender': 'male'}

能够发现，它多了_id属性，这就是MongoDB在插入过程中主动增加的。

此外，咱们也能够依据ObjectId来查问，此时须要应用bson库外面的objectid：

from bson.objectid import ObjectId

result = collection.find_one({'_id': ObjectId('593278c115c2602667ec6bae')})
print(result)

其查问后果仍然是字典类型，具体如下：

{'_id': ObjectId('593278c115c2602667ec6bae'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'}

当然，如果查问后果不存在，则会返回None。

对于多条数据的查问，咱们能够应用find()办法。例如，这里查找年龄为20的数据，示例如下：

results = collection.find({'age': 20})
print(results)
for result in results:
    print(result)

运行后果如下：

<pymongo.cursor.Cursor object at 0x1032d5128>
{'_id': ObjectId('593278c115c2602667ec6bae'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'}
{'_id': ObjectId('593278c815c2602678bb2b8d'), 'id': '20170102', 'name': 'Kevin', 'age': 20, 'gender': 'male'}
{'_id': ObjectId('593278d815c260269d7645a8'), 'id': '20170103', 'name': 'Harden', 'age': 20, 'gender': 'male'}

返回后果是Cursor类型，它相当于一个生成器，咱们须要遍历取到所有的后果，其中每个后果都是字典类型。

如果要查问年龄大于20的数据，则写法如下：

results = collection.find({'age': {'$gt': 20}})

这里查问的条件键值曾经不是单纯的数字了，而是一个字典，其键名为比拟符号$gt，意思是大于，键值为20。

这里将比拟符号演绎为下表。

符号	含意	示例
`$lt`	小于	`{'age': {'$lt': 20}}`
`$gt`	大于	`{'age': {'$gt': 20}}`
`$lte`	小于等于	`{'age': {'$lte': 20}}`
`$gte`	大于等于	`{'age': {'$gte': 20}}`
`$ne`	不等于	`{'age': {'$ne': 20}}`
`$in`	在范畴内	`{'age': {'$in': [20, 23]}}`
`$nin`	不在范畴内	`{'age': {'$nin': [20, 23]}}`

另外，还能够进行正则匹配查问。例如，查问名字以M结尾的学生数据，示例如下：

results = collection.find({'name': {'$regex': '^M.*'}})

这里应用$regex来指定正则匹配，^M.*代表以M结尾的正则表达式。

这里将一些性能符号再归类为下表。

符号	含意	示例	示例含意
`$regex`	匹配正则表达式	`{'name': {'$regex': '^M.*'}}`	`name`以M结尾
`$exists`	属性是否存在	`{'name': {'$exists': True}}`	`name`属性存在
`$type`	类型判断	`{'age': {'$type': 'int'}}`	`age`的类型为`int`
`$mod`	数字模操作	`{'age': {'$mod': [5, 0]}}`	年龄模5余0
`$text`	文本查问	`{'$text': {'$search': 'Mike'}}`	`text`类型的属性中蕴含`Mike`字符串
`$where`	高级条件查问	`{'$where': 'obj.fans_count == obj.follows_count'}`	本身粉丝数等于关注数

对于这些操作的更具体用法，能够在MongoDB官网文档找到：
https://docs.mongodb.com/manu…。

7. 计数

要统计查问后果有多少条数据，能够调用count()办法。比方，统计所有数据条数：

count = collection.find().count()
print(count)

或者统计合乎某个条件的数据：

count = collection.find({'age': 20}).count()
print(count)

运行后果是一个数值，即符合条件的数据条数。

8. 排序

排序时，间接调用sort()办法，并在其中传入排序的字段及升降序标记即可。示例如下：

results = collection.find().sort('name', pymongo.ASCENDING)
print([result['name'] for result in results])

运行后果如下：

['Harden', 'Jordan', 'Kevin', 'Mark', 'Mike']

这里咱们调用pymongo.ASCENDING指定升序。如果要降序排列，能够传入pymongo.DESCENDING。

9. 偏移

在某些状况下，咱们可能想只取某几个元素，这时能够利用skip()办法偏移几个地位，比方偏移2，就疏忽前两个元素，失去第三个及当前的元素：

results = collection.find().sort('name', pymongo.ASCENDING).skip(2)
print([result['name'] for result in results])

运行后果如下：

['Kevin', 'Mark', 'Mike']

另外，还能够用limit()办法指定要取的后果个数，示例如下：

results = collection.find().sort('name', pymongo.ASCENDING).skip(2).limit(2)
print([result['name'] for result in results])

运行后果如下：

['Kevin', 'Mark']

如果不应用limit()办法，原本会返回三个后果，加了限度后，会截取两个后果返回。

值得注意的是，在数据库数量十分宏大的时候，如千万、亿级别，最好不要应用大的偏移量来查问数据，因为这样很可能导致内存溢出。此时能够应用相似如下操作来查问：

from bson.objectid import ObjectId
collection.find({'_id': {'$gt': ObjectId('593278c815c2602678bb2b8d')}})

这时须要记录好上次查问的_id。

10. 更新

对于数据更新，咱们能够应用update()办法，指定更新的条件和更新后的数据即可。例如：

condition = {'name': 'Kevin'}
student = collection.find_one(condition)
student['age'] = 25
result = collection.update(condition, student)
print(result)

这里咱们要更新name为Kevin的数据的年龄：首先指定查问条件，而后将数据查问进去，批改年龄后调用update()办法将原条件和批改后的数据传入。

运行后果如下：

{'ok': 1, 'nModified': 1, 'n': 1, 'updatedExisting': True}

返回后果是字典模式，ok代表执行胜利，nModified代表影响的数据条数。

另外，咱们也能够应用$set操作符对数据进行更新，代码如下：

result = collection.update(condition, {'$set': student})

这样能够只更新student字典内存在的字段。如果原先还有其余字段，则不会更新，也不会删除。而如果不必$set的话，则会把之前的数据全副用student字典替换；如果本来存在其余字段，则会被删除。

另外，update()办法其实也是官网不举荐应用的办法。这里也分为update_one()办法和update_many()办法，用法更加严格，它们的第二个参数须要应用$类型操作符作为字典的键名，示例如下：

condition = {'name': 'Kevin'}
student = collection.find_one(condition)
student['age'] = 26
result = collection.update_one(condition, {'$set': student})
print(result)
print(result.matched_count, result.modified_count)

这里调用了update_one()办法，第二个参数不能再间接传入批改后的字典，而是须要应用{'$set': student}这样的模式，其返回后果是UpdateResult类型。而后别离调用matched_count和modified_count属性，能够取得匹配的数据条数和影响的数据条数。

运行后果如下：

<pymongo.results.UpdateResult object at 0x10d17b678>
1 0

咱们再看一个例子：

condition = {'age': {'$gt': 20}}
result = collection.update_one(condition, {'$inc': {'age': 1}})
print(result)
print(result.matched_count, result.modified_count)

这里指定查问条件为年龄大于20，而后更新条件为{'$inc': {'age': 1}}，也就是年龄加1，执行之后会将第一条符合条件的数据年龄加1。

运行后果如下：

<pymongo.results.UpdateResult object at 0x10b8874c8>
1 1

能够看到匹配条数为1条，影响条数也为1条。

如果调用update_many()办法，则会将所有符合条件的数据都更新，示例如下：

condition = {'age': {'$gt': 20}}
result = collection.update_many(condition, {'$inc': {'age': 1}})
print(result)
print(result.matched_count, result.modified_count)

这时匹配条数就不再为1条了，运行后果如下：

<pymongo.results.UpdateResult object at 0x10c6384c8>
3 3

能够看到，这时所有匹配到的数据都会被更新。

11. 删除

删除操作比较简单，间接调用remove()办法指定删除的条件即可，此时符合条件的所有数据均会被删除。示例如下：

result = collection.remove({'name': 'Kevin'})
print(result)

运行后果如下：

{'ok': 1, 'n': 1}

另外，这里仍然存在两个新的举荐办法——delete_one()和delete_many()。示例如下：

result = collection.delete_one({'name': 'Kevin'})
print(result)
print(result.deleted_count)
result = collection.delete_many({'age': {'$lt': 25}})
print(result.deleted_count)

运行后果如下：

<pymongo.results.DeleteResult object at 0x10e6ba4c8>
1
4

delete_one()即删除第一条符合条件的数据，delete_many()即删除所有符合条件的数据。它们的返回后果都是DeleteResult类型，能够调用deleted_count属性获取删除的数据条数。

12. 其余操作

另外，PyMongo还提供了一些组合办法，如find_one_and_delete()、find_one_and_replace()和find_one_and_update()，它们是查找后删除、替换和更新操作，其用法与上述办法基本一致。

另外，还能够对索引进行操作，相干办法有create_index()、create_indexes()和drop_index()等。

对于PyMongo的具体用法，能够参见官网文档：http://api.mongodb.com/python…。

另外，还有对数据库和汇合自身等的一些操作，这里不再一一解说，能够参见官网文档：http://api.mongodb.com/python…。

本节解说了应用PyMongo操作MongoDB进行数据增删改查的办法。

本资源首发于崔庆才的集体博客静觅： Python3网络爬虫开发实战教程 | 静觅

如想理解更多爬虫资讯，请关注我的集体微信公众号：进击的Coder

weixin.qq.com/r/5zsjOyvEZ… (二维码自动识别)

本文转自 https://juejin.cn/post/6844903597465927694，如有侵权，请分割删除。

关于android:Python连接MongoDB服务

1. 筹备工作

2. 连贯MongoDB

3. 指定数据库

4. 指定汇合

5. 插入数据

6. 查问

7. 计数

8. 排序

9. 偏移

10. 更新

11. 删除

12. 其余操作

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于android:Python连接MongoDB服务

1. 筹备工作

2. 连贯MongoDB

3. 指定数据库

4. 指定汇合

5. 插入数据

6. 查问

7. 计数

8. 排序

9. 偏移

10. 更新

11. 删除

12. 其余操作

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复