共计 2785 个字符,预计需要花费 7 分钟才能阅读完成。
阅读本文大约需要 8 分钟。
写在前面
数据库打算只写 MySQL,Redis 两部分,不会很细,主要以面试题为主。这次写的是 MySQL 篇。
1. 说一下 char、varchar、text 的区别
这里先介绍一下数据库的概念,数据库是一种数据结构,内含多种算法,帮助我们将数据以最优化的方式存储在计算机中,也可以帮助我们快速找到存储的数据。
数据最终存储在计算机中都是以「二进制」的方式存储。比如 4,存储在计算机中其实是以 0100 的方式存储。比如 A,存储在计算中是以 0100 0001 的方式存储。
char
:定长字符型,最大可存储 255(2 的 8 次方)个字节长度,可以理解成最大可以存储 255 个字符。在计算机中以 8 位二进制的方式存储。
使用 char
类型存储数据时,假设存储的数据是 4,4 在计算机中存储的结果是 0000 0100,意味着使用定长字符型char
,不管你存储的值是多少位,最终在计算机里都是以 8 位二进制的方式存储,不满 8 位,前面补 0。超过 8 位,超出的部分会被去除。
也就是说当使用 char
字符型存储数据后,该数据转换为二进制时的长度超过了 8 位,那么该数据将不会完整存储,会「丢失」一部分数据。
varchar
:不定长字符型,最大可存储 65535(2 的 16 次方)个字节长度,在计算机中以 16 位 二进制的方式存储。
它与 char
不同的地方在于,当字符长度在 0-255 以内时,会在后面添加一个字节,超过 255 时,添加两个字节。同样的,当超过最大存储长度后,也会丢失一部分数据。
text
:长文本数据类型,最大可存储 65555 个字节长度,不能指定长度,也就是说不支持text(num)
。
但是该类型尽量不要使用,因为 text
类型数据在检索中,不会使用索引,而是使用全局搜索,这会产生临时表,使得检索时间变长,不推荐使用。
由于 char
和varchar
的特性,在实际使用当中,如果该数据是经常会发生变化、经常使用的,那么推荐使用 char
类型,因为 MySQL 在对数据进行排序时,会根据该数据的长度来排,固定长度的 char
类型会提供更高的性能。但是由于固定长度的特性,在存储短数据时,一定程度上也会造成资源浪费,算是一个双刃剑。
2. varchar(100)中的 100 有什么意义
100 只是在呈现角度上定义的,比如该数据有 120 个字符,那么你在查询该数据时,看到的只有 100 个。但是如果在定义时,添加了 UNSIGNED ZEROFILL
属性,那么这将改变该类型的最大存储长度。
同样的,在实际使用当中,varchar(num)
里的值不需要定义的特别长,只要够用就行,具体原因上面有提,这里不再赘述。
3. 说一说 DROP、DELETE、TRUNCATE 的区别
DORP
:非事务操作,彻底删除一张表,无法反悔恢复。
DELETE
:事务操作,删除表里的一行或多行数据,如果反悔或是误删,可以通过「事务回滚」恢复该表。不会影响该表下的 view
或索引。
TRUNCATE
:非事务操作,删除表里的某行数据,或是删除整张表的数据(表依然存在,只是成了一张空表)。无法反悔恢复,并且会将该表下的 view
或索引重置。
执行速度:DROP > TRUNCATE > DELETE。
4. 说一说 MySQL 三范式
第一范式:表中的字段只能表达一种意思,不能模棱两可。
第二范式:表必须含有一个唯一主键来标识这张表。
第三范式:表中的字段不能互相依赖。
5. 说一说 MySQL 中如何分区、分表
Scale Out(垂直切分)
Scale Up(横向拆分)
这里有篇文章值得看一看。MySQL 分区、分表
6. 了解索引吗
如果把数据库当做一本书的话,那么索引就是书的「目录页」,通过目录,我们可以快速定位查找内容,同样的,目录页在书中也占了一页纸,所以索引是一个数据结构,也要占据数据库物理内存。
索引分为 4 种类型:普通索引、唯一索引、主键索引和全文索引(MyISAM 专有)。
索引的创建规则:经常使用的字段名,和出现在 where 后面的字段名,建议为它们创建索引,索引要遵循最左前缀原则(最能体现该索引特征,也就是常用的字段放最左边)。
索引的原理:可以看看这篇文章。索引
索引的使用场景:中等、大量数据时,使用索引效率会非常高,小型数据不建议使用索引,没有全局搜索来的快。
索引的作用:索引可以提高查询速度。但是索引会增加数据库存储额外开销。索引会将数据库查询时的随机 I/O 变成顺序 I/O,减少服务器排序操作,和临时表的开销。
7. 说一下常用的 MySQL 优化手段
- 使用
EXPLAIN
查看 SQL 执行计划,帮助自己查看哪些地方可以优化。 - 杜绝使用
SELECT * FROM xxx
这种查询语句,需要什么就查什么。 - 尽量不要使用
text
这种类型,这会使得数据查询该字段时,创建临时表。 - 明确知道查询数据结果大概有几行时,使用
LIMIT
,为查询结果限制显示页数。 - 避免使用 MySQL 的内置函数。
- 尽量使用
EXISTS
和BETWEEN
代替IN
。 - 避免在
WHERE
中使用表达式操作,这会使得 MySQL 放弃使用索引查询。 - 尽量使用小表驱动大表(从小的表中,查找跟大表中有关系的数据),可以减少 CPU 运算次数,以及 I/O 总量。
- 尽量使用
INNER JOIN
而不是LEFT JOIN
,因为前者默认使用小表驱动大表。 - 索引要遵循最左前缀法则。
- 避免使用模糊查询
LIKE
。 - 避免设置字段
NULL
属性,在对NULL
进行判断时,会使得 MySQL 放弃使用索引。
8. InnoDB 和 MyISAM 的区别
- InnoDB 支持外键,MyISAM 不支持。
- MyISAM 拥有全文索引,InnoDB 没有。
- 数据库崩溃后,InnoDB 可以安全恢复,而 MyISAM 不可以。
- InnoDB 拥有事务,而 MyISAM 没有。
- InnoDB 拥有行锁,而 MyISAM 拥有表锁。
- MyISAM 计算
COUNT(*)
时,速度远高于 InnoDB。
9. 什么是事务
InnoDB 引擎下,MySQL 支持事务操作,事务拥有以下几个特点:
- 原子性
- 可靠性
- 稳定性
- 隔离性
使用事务的操作,要么执行,要么不执行,只有一个结果,但是事务可以回滚,也就是撤回操作。
10. 说一下悲观锁、乐观锁
InnoDB 引擎下的 MySQL 在处理高并发时,会对 MySQL 数据库添加锁机制,以此完成并发的要求,并保证数据的完整性,可靠性。
悲观锁是 MySQL 为数据库添加行锁,强行为多个事务排序,阻塞事务运行,解决事务之间的冲突问题,但是事务之间有可能出现长时间等待,且开锁、解锁需要额外的数据库资源消耗。所以要谨慎使用。
乐观锁没有锁机制,但是引入了版本号控制,在高并发时,数据库在事务提交之前会进行版本号校验,如果版本后前后不一致,说明此刻有其他事务正在操作,那么本次事务重新操作。
版本号的好处在于没有锁的开销,并且只在事务最后提交更改时进行判断,但是也要考虑重新执行的代价是否过大。
总的来说,高并发下,读操作多的时候,使用乐观锁,写的操作时,使用悲观锁。
未更完,下次更新补上。