关于mysql:面试官你说说一条更新SQL的执行过程

48次阅读

共计 1974 个字符,预计需要花费 5 分钟才能阅读完成。

在上一篇《面试官:你说说一条查问 SQL 的执行过程?》中形容了 Mysql 的架构分层,通过解析器、优化器和执行引擎实现一条 SQL 查问的过程,那这一篇续上持续阐明一条更新 SQL 的执行过程。

对于一个 SQL 语句的更新来说,后面的流程都能够说相似的,通过解析器进行语法分析,优化器优化,执行引擎去执行,这个都没有什么问题,重点在于多了一点货色,那就是 redo_logundo_logbinlog

执行流程大抵如下:

  1. 首先客户端发送申请到服务端,建设连贯。
  2. 服务端先看下查问缓存,对于更新某张表的 SQL,该表的所有查问缓存都生效。
  3. 接着来到解析器,进行语法分析,一些零碎关键字校验,校验语法是否合规。
  4. 而后优化器进行 SQL 优化,比方怎么抉择索引之类,而后生成执行打算。
  5. 执行引擎去存储引擎查问须要更新的数据。
  6. 存储引擎判断以后缓冲池中是否存在须要更新的数据,存在就间接返回,否则去从磁盘加载数据。
  7. 执行引擎调用存储引擎 API 去更新数据。
  8. 存储引擎更新数据,同时写入 undo_log、redo_log 信息。
  9. 执行引擎写 binlog,提交事务,流程完结。

能够看到相比于查问流程,实际上更新多了对于 undo_log 和 redo_log 的流程,接下来再具体探讨一下这几个流程的执行过程是什么样子。

redo_log

redo_log依照字面翻译称为 重做日志,是 InnoDB 存储引擎特有的,用于保障事务的原子性和持久性。怎么了解呢?简略来说就是保留咱们执行的更新语句的记录,如果服务器或者 Mysql 宕机,通过 redo_log 能够复原更新的数据。

依照上述流程来举例的话,比方 update user set age=20 where id=1 这样的简略更新 SQL,咱们不论执行引擎怎么拿到的数据,不论是从缓冲池拿的还是磁盘拿到的,这条当初数据都在缓冲池外面,而后去缓冲池的数据把 age 改成 10。

缓冲池内存中的数据曾经更新好了,那么接下来就该开始写 redo_log 了,只是 redo_log 也不是间接写文件的,个别都是这样对吧,间接写的话性能太差了,所以就有 redo_log_buffer 叫做 redo_log 缓冲。

在写 redo_log 的时候先把数据写到 redo_log 缓冲区,而后异步写入磁盘,很显然,极其状况下会有失落数据的可能。

管制这个刷盘策略的的参数叫做innodb_flush_log_at_trx_commit

这个参数有 3 个值:0|1|2,默认的话是 1。

0 代表提交事务时不会写入磁盘,这样的话性能当然最好,然而在 Mysql 宕机的状况会失落上一秒的事务的数据。

1 代表提交事务肯定会进行一次刷盘,同步当然性能最差,然而也最平安。

2 代表写入文件系统的缓存,不进行刷盘。这个选项性能略差于 1,Mysql 宕机的话对数据没有任何影响,只有在操作系统宕机才会失落数据,这种状况下默认 Mysql 每秒会执行一次刷盘。

应用 0 或者 2 尽管进步了性能,然而变相的也丢失了事务的持久性。

undo_log

重做日志保障了事务的持久性,保障可能在宕机后复原事务的数据,那么另外一种状况就是事务在须要回滚的时候怎么办?这时候就是 undo_log 的作用了,它保障了事务的一致性。

对于 undo_log 来说,简略了解就是做了逆向操作。

比方 insert 一条数据,就对应生成 deleteupdate 语句则生成相同的更新语句,这样做到将数据批改回之前的状态。

binlog

binlog 称为二进制日志,大家都很相熟,记录了扭转数据库的那些 SQL 语句,对于这里来说,更新语句当然是了。

通过不同于 redo_log 是独属于存储引擎独有的货色,binlog则是 Mysql 自身产生的日志。

不同于 redo_log 是物理日志,binlog 和 undo_log 都属于逻辑日志。

这有什么区别呢?

简略来说,逻辑日志能够认为就是存储的 SQL 自身,而物理日志看看 redo_log 存储的是啥就晓得了,对于 page_id 页 ID,offset 偏移量啊这些货色,记录的是对页的批改。

另外物理日志能够保障幂等性,而逻辑日志则不肯定能,除非自身 SQL 就是幂等的。

下面咱们提到了 redo_log 的刷盘策略,binlog 就和它十分相似了,控制参数是sync_binlog

默认值为 0,相当于是 innodb_flush_log_at_trx_commit 的值为 2,由文件系统管制,同样如果服务器宕机,binlog 失落,当然咱们也能够改成 1,就和 redo_log 的成果是一样,每 1 次事务提交都同步写入磁盘。

事务

为了保障写 redo_log 和 binlog 的一致性,理论采纳了二阶段提交的形式。

prepare 阶段:依据 innodb_flush_log_at_trx_commit 设置的刷盘策略决定是否写入磁盘,标记为 prepare 状态。

commit 阶段:写入 binlog 日志,事务标记为提交状态。

总结

正文完
 0