Python-面试第五次更新

jiezi

5 年前

阅读本文大约需要 8 分钟。

数据库打算只写 MySQL，Redis 两部分，不会很细，主要以面试题为主。这次写的是 MySQL 篇。

这里先介绍一下数据库的概念，数据库是一种数据结构，内含多种算法，帮助我们将数据以最优化的方式存储在计算机中，也可以帮助我们快速找到存储的数据。

数据最终存储在计算机中都是以「二进制」的方式存储。比如 4，存储在计算机中其实是以 0100 的方式存储。比如 A，存储在计算中是以 0100 0001 的方式存储。

char：定长字符型，最大可存储 255（2 的 8 次方）个字节长度，可以理解成最大可以存储 255 个字符。在计算机中以 8 位二进制的方式存储。

使用 char 类型存储数据时，假设存储的数据是 4，4 在计算机中存储的结果是 0000 0100，意味着使用定长字符型char，不管你存储的值是多少位，最终在计算机里都是以 8 位二进制的方式存储，不满 8 位，前面补 0。超过 8 位，超出的部分会被去除。

也就是说当使用 char 字符型存储数据后，该数据转换为二进制时的长度超过了 8 位，那么该数据将不会完整存储，会「丢失」一部分数据。

varchar：不定长字符型，最大可存储 65535（2 的 16 次方）个字节长度，在计算机中以 16 位二进制的方式存储。

它与 char 不同的地方在于，当字符长度在 0-255 以内时，会在后面添加一个字节，超过 255 时，添加两个字节。同样的，当超过最大存储长度后，也会丢失一部分数据。

text：长文本数据类型，最大可存储 65555 个字节长度，不能指定长度，也就是说不支持text(num)。

但是该类型尽量不要使用，因为 text 类型数据在检索中，不会使用索引，而是使用全局搜索，这会产生临时表，使得检索时间变长，不推荐使用。

由于 char 和varchar的特性，在实际使用当中，如果该数据是经常会发生变化、经常使用的，那么推荐使用 char 类型，因为 MySQL 在对数据进行排序时，会根据该数据的长度来排，固定长度的 char 类型会提供更高的性能。但是由于固定长度的特性，在存储短数据时，一定程度上也会造成资源浪费，算是一个双刃剑。

100 只是在呈现角度上定义的，比如该数据有 120 个字符，那么你在查询该数据时，看到的只有 100 个。但是如果在定义时，添加了 UNSIGNED ZEROFILL 属性，那么这将改变该类型的最大存储长度。

同样的，在实际使用当中，varchar(num)里的值不需要定义的特别长，只要够用就行，具体原因上面有提，这里不再赘述。

DORP：非事务操作，彻底删除一张表，无法反悔恢复。

DELETE：事务操作，删除表里的一行或多行数据，如果反悔或是误删，可以通过「事务回滚」恢复该表。不会影响该表下的 view 或索引。

TRUNCATE：非事务操作，删除表里的某行数据，或是删除整张表的数据（表依然存在，只是成了一张空表）。无法反悔恢复，并且会将该表下的 view 或索引重置。

执行速度：DROP > TRUNCATE > DELETE。

第一范式：表中的字段只能表达一种意思，不能模棱两可。

第二范式：表必须含有一个唯一主键来标识这张表。

第三范式：表中的字段不能互相依赖。

Scale Out（垂直切分）

Scale Up（横向拆分）

这里有篇文章值得看一看。MySQL 分区、分表

如果把数据库当做一本书的话，那么索引就是书的「目录页」，通过目录，我们可以快速定位查找内容，同样的，目录页在书中也占了一页纸，所以索引是一个数据结构，也要占据数据库物理内存。

索引分为 4 种类型：普通索引、唯一索引、主键索引和全文索引（MyISAM 专有）。

索引的创建规则：经常使用的字段名，和出现在 where 后面的字段名，建议为它们创建索引，索引要遵循最左前缀原则（最能体现该索引特征，也就是常用的字段放最左边）。

索引的原理：可以看看这篇文章。索引

索引的使用场景：中等、大量数据时，使用索引效率会非常高，小型数据不建议使用索引，没有全局搜索来的快。

索引的作用：索引可以提高查询速度。但是索引会增加数据库存储额外开销。索引会将数据库查询时的随机 I/O 变成顺序 I/O，减少服务器排序操作，和临时表的开销。

使用 EXPLAIN 查看 SQL 执行计划，帮助自己查看哪些地方可以优化。
杜绝使用 SELECT * FROM xxx 这种查询语句，需要什么就查什么。
尽量不要使用 text 这种类型，这会使得数据查询该字段时，创建临时表。
明确知道查询数据结果大概有几行时，使用LIMIT，为查询结果限制显示页数。
避免使用 MySQL 的内置函数。
尽量使用 EXISTS和 BETWEEN 代替IN。
避免在 WHERE中使用表达式操作，这会使得 MySQL 放弃使用索引查询。
尽量使用小表驱动大表（从小的表中，查找跟大表中有关系的数据），可以减少 CPU 运算次数，以及 I/O 总量。
尽量使用 INNER JOIN 而不是LEFT JOIN，因为前者默认使用小表驱动大表。
索引要遵循最左前缀法则。
避免使用模糊查询LIKE。
避免设置字段 NULL 属性，在对 NULL 进行判断时，会使得 MySQL 放弃使用索引。

InnoDB 支持外键，MyISAM 不支持。
MyISAM 拥有全文索引，InnoDB 没有。
数据库崩溃后，InnoDB 可以安全恢复，而 MyISAM 不可以。
InnoDB 拥有事务，而 MyISAM 没有。
InnoDB 拥有行锁，而 MyISAM 拥有表锁。
MyISAM 计算 COUNT(*)时，速度远高于 InnoDB。

InnoDB 引擎下，MySQL 支持事务操作，事务拥有以下几个特点：

原子性
可靠性
稳定性
隔离性

使用事务的操作，要么执行，要么不执行，只有一个结果，但是事务可以回滚，也就是撤回操作。

InnoDB 引擎下的 MySQL 在处理高并发时，会对 MySQL 数据库添加锁机制，以此完成并发的要求，并保证数据的完整性，可靠性。

悲观锁是 MySQL 为数据库添加行锁，强行为多个事务排序，阻塞事务运行，解决事务之间的冲突问题，但是事务之间有可能出现长时间等待，且开锁、解锁需要额外的数据库资源消耗。所以要谨慎使用。

乐观锁没有锁机制，但是引入了版本号控制，在高并发时，数据库在事务提交之前会进行版本号校验，如果版本后前后不一致，说明此刻有其他事务正在操作，那么本次事务重新操作。

版本号的好处在于没有锁的开销，并且只在事务最后提交更改时进行判断，但是也要考虑重新执行的代价是否过大。

总的来说，高并发下，读操作多的时候，使用乐观锁，写的操作时，使用悲观锁。

未更完，下次更新补上。

Python-面试第五次更新

写在前面

1. 说一下 char、varchar、text 的区别

2. varchar（100）中的 100 有什么意义

3. 说一说 DROP、DELETE、TRUNCATE 的区别

4. 说一说 MySQL 三范式

5. 说一说 MySQL 中如何分区、分表

6. 了解索引吗

7. 说一下常用的 MySQL 优化手段

8. InnoDB 和 MyISAM 的区别

9. 什么是事务

10. 说一下悲观锁、乐观锁