有坑勿踩（三）——关于数据更新

前言
数据更新，CRUD中的U，对任何数据库而言都是最基本的操作。看似简单的更新操作中会藏着哪些坑？今天聊一聊这个话题。
在写这个系列文章时，我会假设读者已经对MongoDB有了最基础的了解，因此一些基本名词和概念就不做过多的解释，请自己查阅相关资料。
数据更新方式
以shell为例，MongoDB的数据更新可以使用以下几种方式：

db.<collection>.update()
db.<collection>.updateMany()
db.<collection>.updateOne()
db.<collection>.save()
db.<collection>.findAndModify()

前三种是由于历史原因产生的，实际上：

updateMany = update + {multi: true}
updateOne = update 或 update + {multi: false}

因为update本身的意义不够清楚，所以3.0以后才出现了updateMany和updateOne两个替代方法。这个方法没多少要说的，唯一要注意的就是，如果用update方法的话，不要忘记操作符（$set, $inc等等），不然……updateMany和updateOne则没有这个问题，缺了操作符会直接报错。
更新操作对比
update三兄弟和findAndModify
很多人的疑问可能都在这里，它们到底有什么区别，傻傻分不清楚。首先参数不一样：

findAndModify
update

请阅读文档不多赘述。其次功能不一样，update只是更新操作，而findAndModify可以在找到结果后选择执行更新还是删除操作。说白了功能上findAndModify=updateOne+removeOne。注意它只能对单个文档进行操作。无论更新还是删除，(『找到』『更新』)或(『找到』『删除』)都是原子性的，这点findAndModify和updateOne/removeOne没有任何区别。区别只在于findAndModify在完成动作之后还可以选择把更新/删除之前或之后的文档返回给你。如果没有这个操作，那就必须先find再update或者先update再find，无论怎么做，都不能保证中间不被其他操作捷足先登。因此findAndModify在某些场景下是必要的，比如使用$inc生成递增序列（注意生成递增序列做ID不是个好想法，我在这个问题中做过解释）因为findAndModify只针对单个文档，那么如果条件能找到多个文档怎么办？sort就用在这种场景下。
update和save
save实际上是一种特殊的update，即不带操作符的update。通俗地说叫『替换』。替换，代表你已经有这个文档完整的样子，即代表你已经把整个文档从数据库中读出来，在内存中进行了修改，然后完整替换回去。你并不能保证数据在被你读出来到写回去期间是否有别人已经改了数据库中的记录，这就是第一个风险，save操作存在潜在的可能性会覆盖掉别人更新过的数据。例如：
db.celebrity.findOne()
{
_id: “孙悟空”,
title: “石猴”
age: 500
}
你执行了:
var obj = db.celebrity.findOne({_id: “孙悟空”});
obj.title = “弼马温”;
// 其他操作
db.celebrity.save(obj);
在『其他操作』的地方有人把孙悟空的title更新成了『齐天大圣』，很显然在你save的时候你会把它改回『弼马温』。
除了上述问题，save还带来一个额外的副作用，因为整个文档都保存进去了，意味着整个文档都会进入oplog，这会显著增加oplog的使用速度。因此过度使用save常常还会造成oplog不够用，需要很大的oplog才能足够保存24小时的信息。

有坑勿踩（三）——关于数据更新

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

有坑勿踩（三）——关于数据更新

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复