关于分库分表:分库分表是怎么做的

在高并发的场景中，单库曾经不能满足性能的要求，这才有了数据库演进之路。

单个分片

partition key两种形式：范畴和hash。
范畴的话比方用户的注册工夫、用户的地理位置。毛病是热点调配不平均，比方北上广的客户群里多，新注册的用户比拟沉闷，导致这些热点库的压力会比拟大。
散列的话比方依据用户的id进行hash。长处是每个库的读写压力大概率是平均的，毛病是扩容不不便。

多个分片

多个分片的场景，就是可能依据多个维度进行查问。比方用户表的partition key是id，那咱们能够依据hash(id)晓得查问哪个库。如果用户表的partition key是uname，咱们也能够依据hash(uname)晓得查问哪个库。如果咱们设置id为partition key，那依据uname查问的时候，就不晓得对应的库在哪里，此时就要全库搜寻。

双写

同时下两个数据库，如果依据id查找，那去依据id分片的数据库查问，如果依据uname查找，那去依据uname分片的数据库查问。这个计划，尽管防止了全库搜寻，然而用空间换工夫的代价有点大啊，而且插入的时候还要保障数据库的一致性。

索引

插入数据库的时候，同步更新uname在哪个数据库。依据uname查问的时候，先查问uname在哪个库，而后依据这个值去指定的数据库查问。

毛病：

同样也是双写，须要保证数据的一致性。
读取的时候，多查问了一次，影响性能。
扩容的时候，须要更改表数据信息。

基因法

既然不晓得对应关系，那就插入数据的时候，就给个标识符。
基因法（假如模16）：

username取后4位
id生成60位
把username的后4位加到id前面

模16=2的4次方，所以是取4位。这样不论是对uname取模，还是对id取模，实际上都是对这两个的后4位取模，通过基因法，这后4位是落在一个数据库上的，所以不论通过uname还是id，都能找到对应的数据库。

扩容计划

停机扩容

这个计划比拟暴力，个别在没什么人用零碎的时候，比方凌晨，间接把零碎停了，停机之前挂个布告告诉几点到几点不能用。如果数据量比拟大的话，还可能在这个工夫做不完。。。

双写

首先，写一个同步的工具，把旧数据库的信息写到新数据库。在应用层中，每次查问走的是旧数据库，对数据库的批改、删除、新增，两个库都要操作。因为同步工具和应用层都会对数据库进行操作，所以有可能反复操作某个数据，此时每个表须要一个操作工夫，以工夫比拟新的数据为准。

从库转主库

如下图所示，每个数据库都有对应的从库。迁徙的时候间接把从库该主库就好。

上面是每个数据库的数据以及主从的状况：

此时把3个数据库变成6个数据库，也就是从id%3变成id%6。

以id%3=1的为例，之前数据为1，4，7，10，13，16，19的id会读取id%3=1的数据库，扩容后，1，7，13，19的id会读取id%6=1的数据库，而4，10，16的id会读取id%6=4的数据库。
这种形式，迁徙简直不必导入数据，能够霎时切换，毛病就是数据冗余，须要在扩容后，把多余的数据清空。

关于分库分表:分库分表是怎么做的

单个分片

多个分片

双写

索引

基因法

扩容计划

停机扩容

双写

从库转主库

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于分库分表:分库分表是怎么做的

单个分片

多个分片

双写

索引

基因法

扩容计划

停机扩容

双写

从库转主库

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复