搞定PHP面试 - MySQL基础知识点整理 - 存储引擎

林大鹏

2019-11-17

MySQL基础知识点整理 - 存储引擎

0. 查看 MySQL 支持的存储引擎

可以在 mysql 客户端中，使用 show engines; 命令可以查看MySQL支持的引擎：

mysql> show engines;
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| Engine             | Support | Comment                                                        | Transactions | XA   | Savepoints |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| InnoDB             | DEFAULT | Supports transactions, row-level locking, and foreign keys     | YES          | YES  | YES        |
| MRG_MYISAM         | YES     | Collection of identical MyISAM tables                          | NO           | NO   | NO         |
| MEMORY             | YES     | Hash based, stored in memory, useful for temporary tables      | NO           | NO   | NO         |
| BLACKHOLE          | YES     | /dev/null storage engine (anything you write to it disappears) | NO           | NO   | NO         |
| MyISAM             | YES     | MyISAM storage engine                                          | NO           | NO   | NO         |
| CSV                | YES     | CSV storage engine                                             | NO           | NO   | NO         |
| ARCHIVE            | YES     | Archive storage engine                                         | NO           | NO   | NO         |
| PERFORMANCE_SCHEMA | YES     | Performance Schema                                             | NO           | NO   | NO         |
| FEDERATED          | NO      | Federated MySQL storage engine                                 | NULL         | NULL | NULL       |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
9 rows in set (0.06 sec)

1. InnoDB 引擎

InnoDB 是 MySQL 默认的存储引擎，也是最重要、使用最广泛的存储引擎。
InnoDB 的性能和自动崩溃恢复特性，使得它在非事务型存储的需求中也很流行。
除非有非常特别的原因需要使用其他的存储引擎，否则应该优先考虑 InnoDB 引擎。

InnoDB 的特性

支持事务。
支持外键约束。
支持行级锁机制。
支持崩溃后的安全恢复。
通过一些机制和工具支持真正的热备份。
会在主内存中建立其专用的缓冲池用于高速缓冲数据和索引，因此InnoDB的表需要更多的内存和存储空间。
InnoDB是聚集索引，数据文件是和索引绑在一起的，必须要有主键，通过主键索引效率很高。但是辅助索引需要两次查询，先查询到主键，然后再通过主键查询到数据。因此，主键不应该过大，因为主键太大，其他索引也都会很大。
InnoDB 不保存表的具体行数，执行 select count(*) from table 时需要全表扫描。

InnoDB 存储表和索引有两种方式

使用共享表空间存储： 表结构保存在 .frm 文件中，数据和索引在 innodb_data_home_dir 和 innodb_data_file_path 定义的表空间中，可以是多个文件。
使用多表空间存储： 表结构保存在 .frm 文件中，每个表的数据和索引单独保存在 .ibd 中。

InnoDB 的使用场景

更新密集的表： InnoDB存储引擎特别适合处理多重并发的更新请求。
事务： InnoDB存储引擎是支持事务的标准MySQL存储引擎。
自动灾难恢复： InnoDB表能够自动从灾难中恢复。
外键约束： MySQL支持外键的存储引擎只有InnoDB。
支持自动增加列 AUTO_INCREMENT 属性。

2. MyISAM 引擎

MyISAM 是 MySQL 5.1 及之前版本的默认存储引擎。MySQL 8 即将废弃 MyISAM 引擎。
MyISAM 提供了全文索引、压缩、空间函数（GIS）等特性。
MyISAM 不支持事务和行级锁，崩溃后无法安全恢复。

MyISAM 的特性

支持全文索引。
支持表级锁，不支持行级锁。
不支持事务。
拥有较高的插入，查询速度。
MyISAM 是非聚集索引，数据文件是分离的，索引保存的是数据文件的指针。主键索引和辅助索引是独立的。
MyISAM 用一个变量保存了整个表的行数，执行 select count(*) from table 时只需要读出该变量即可，速度很快。

MyISAM 的三种存储格式

MyISAM 的三种存储格式分别为静态、动态和压缩。MyISAM 会根据表的定义自动选择存储格式。

静态表： 如果数据表中的各数据列的长度都是预先固定好的，服务器将自动选择这种表类型。因为数据表中每一条记录所占用的空间都是一样的，所以这种表存取和更新的效率非常高。当数据受损时，恢复工作也比较容易做。
动态表： 如果数据表中出现 varchar 、*text 或 *BLOB 字段时，服务器将自动选择这种表类型。相对于静态MyISAM，这种表存储空间比较小，但由于每条记录的长度不一，所以多次修改数据后，数据表中的数据就可能离散的存储在内存中，进而导致执行效率下降。同时，内存中也可能会出现很多碎片。因此，这种类型的表要经常用 optimize table 命令或优化工具来进行碎片整理。
压缩表： 以上说到的两种类型的表都可以用myisamchk工具压缩。如果表在创建并导入数据后，不在进行修改操作，这样的表适合采用 MyISAM 压缩表。这种类型的表进一步减小了占用的存储，但是这种表压缩之后不能再被修改。另外，因为是压缩数据，所以这种表在读取的时候要先时行解压缩。

MyISAM 表存储

每个 MyISAM 表在磁盘上存储成三个文件，每一个文件的名字均以表的名字开始，扩展名指出文件类型。
.frm 文件存储表结构定义。
.MYD (MYData) 文件存储表的数据。
.MYI (MYIndex) 文件存储表的索引。

MyISAM 使用场景

查询密集型表： MyISAM 存储引擎在筛选大量数据时非常快，是它最突出的优点；
插入密集型表： MyISAM 的并发插入特性允许同时选择、插入数据。例如：MyISAM存储引擎非常适合管理邮件或Web服务器日志数据。

3. MEMORY 引擎

MEMORY 引擎（也叫 HEAP 引擎），将所有数据都保存在内存中，不需要进行磁盘I/O。因此，MEMORY表至少比 MyISAM 表快一个数量级。
MySQL 重启或 mysqld 守护进程崩溃时，Memory 表的结构还会保留，但是所有的数据都会丢失。

获得速度的同时也带来一些缺陷。它要求存储在Memory数据表里的数据用的是长度不变的格式，这意味着不能用BLOB和TEXT这样的长度可变的数据类型，VARCHAR是种长度可变的类型，但因为它在MySQL内部当做长度固定不变的CHAR类型，所以可以使用。

MEMORY 的特性

数据都保存在内存中，不需要进行磁盘I/O。
支持 Hash 索引和B树索引。
支持表级锁，不支持行级锁。
服务重启后，表结构还会保留，但是数据会丢失。
不支持 TEXT 和 BLOB 类型的列。

MEMORY 使用场景

需要快速地访问数据，并且这些数据不会被修改，重启以后丢失也没有关系。
用于查找（lookup）或者映射（mapping）表，例如将邮编和地址映射的表。
用于保存数据分析中产生的中间数据。
用于缓存周期性聚合数据的结果。

4. ARCHIVE 引擎

ARCHIVE 引擎是一个针对插入和压缩做了优化的简单存储引擎。
ARCHIVE 引擎只支持 INSERT 和 SELECT 操作。MySQL 5.1 之前也不支持索引。
ARCHIVE 引擎会利用 zlib 对插入的行进行压缩，所以比 MyISAM 表的磁盘 I/O 更少。

ARCHIVE 的特性

只支持 INSERT 和 SELECT 操作。
MySQL 5.1 之前不支持索引。
支持行级锁和专用缓冲区。

ARCHIVE 使用场景

适合日志和数据采集类应用，这类应用做数据分析时往往需要全表扫描。
需要快速 INSERT 操作的场景。

5. MERGE 引擎

MERGE 存储引擎是 MyISAM 引擎的变种。MERGE 表是由多个 MyISAM 表合并而来的虚拟表，这些MyISAM表结构必须完全相同。Merge表中并没有数据，对Merge类型的表可以进行查询、更新、删除操作，这些操作实际上是对内部的MyISAM表进行操作。

Merge存储引擎使用场景对于服务器日志这种信息，一般常用的存储策略是将数据分成很多表，每个名称与特定时间端相关。例如：可以用12个相同的表来存储服务器的日志数据，每个表用对应各个月份的名字来命名。当有必要基于所有12个日志表的数据来生成报表时，这意味着需要编写、更新多表查询，以反映这些表中的信息。与其编写这些可能会出现错误的查询，不如将这些表合并起来使用一条查询，之后再删除Merge表而不影响原来的数据，删除Merge表只会删除掉Merge表的定义，对内部表没有任何影响。

但是引入分区功能后，该引擎已经被放弃。

6. CSV 引擎

CSV 引擎可以将普通的 CSV 文件作为 MySQL 的表来处理，但是这种表不支持索引。

CSV 的特点

可以将普通的 CSV 文件作为 MySQL 的表来处理。
所有的列必须都是不能为NULL的
不支持索引（不适合大表，不适合在线处理）
可以对数据文件直接编辑（保存文本文件内容）

CSV 使用场景

适合做为数据交换的中间表（能够在服务器运行的时候，拷贝和拷出文件，可以将电子表格存储为CSV文件再拷贝到MySQL数据目录下，就能够在数据库中打开和使用。同样，如果将数据写入到CSV文件数据表中，其它web程序也可以迅速读取到数据。

mysql 存储引擎