MySQL高级【三】MySQL 体系结构和存储引擎
MySQL的体系结构概览
整个MySQL Server由以下组成:
- Connection Pool : 连接池组件
- Management Services & Utilities : 管理服务和工具组件
- SQL Interface : SQL接口组件
- Parser : 查询分析器组件
- Optimizer : 优化器组件
- Caches & Buffers : 缓冲池组件
- Pluggable Storage Engines : 存储引擎
- File System : 文件系统
连接层
最上层是一些客户端和链接服务,包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于 TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
服务层
第二层架构主要完成大多数的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化,部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。在该层,服务器会解析查询并创建相应的内部解析树,并对其完成相应的优化如确定表的查询的顺序,是否利用索引等, 最后生成相应的执行操作。如果是 select 语句,服务器还会查询内部的缓存,如果缓存空间足够大,这样在解决大量读操作的环境中能够很好的提升系统的性能。
引擎层
存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样我们可以根据自己的需要,来选取合适的存储引擎。
存储层
数据存储层, 主要是将数据存储在文件系统之上,并完成与存储引擎的交互。
优势:和其他数据库相比,MySQL 的架构可以在多种不同场景中应用并发挥良好作用,主要体现在存储引擎上,插件式的存储引擎架构,将查询处理和其他的系统任务以及数据的存储提取分离,这种架构可以根据业务的需求和实际需要选择合适的存储引擎。
存储引擎
概述
和大多数的数据库不同,MySQL 中有一个存储引擎的概念,针对不同的存储需求可以选择最优的存储引擎。
存储引擎就是存储数据,建立索引,更新查询数据等等技术的实现方式 。存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。
Oracle、SqlServer 等数据库只有一种存储引擎。MySQL 提供了插件式的存储引擎架构,所以 MySQL 存在多种存储引擎,可以根据需要使用相应引擎,或者编写存储引擎。
MySQL5.0 支持的存储引擎包含 : InnoDB 、MyISAM 、BDB、MEMORY、MERGE、EXAMPLE、NDB Cluster、ARCHIVE、CSV、BLACKHOLE、FEDERATED 等,其中 InnoDB 和 BDB 提供事务安全表,其他存储引擎是非事务安全表。
创建新表时如果不指定存储引擎,那么系统就会使用默认的存储引擎,MySQL5.5 之前的默认存储引擎是MyISAM,5.5之后就改为了InnoDB。
可以通过指定 show engines
, 来查询当前数据库支持的存储引擎 。
查看Mysql数据库默认的存储引擎 , 指令 :
show variables like ‘%storage_engine%‘ ;
各种存储引擎特性
特点 | InnoDB | MyISAM | MEMORY | MERGE | NDB |
---|---|---|---|---|---|
存储限制 | 64TB | 有 | 有 | 没有 | 有 |
事务安全 | 支持 | ||||
锁机制 | 行锁(适合高并发) | 表锁 | 表锁 | 表锁 | 行锁 |
B树索引 | 支持 | 支持 | 支持 | 支持 | 支持 |
哈希索引 | 支持 | ||||
全文索引 | 支持(5.6版本之后) | 支持 | |||
集群索引 | 支持 | ||||
数据索引 | 支持 | 支持 | 支持 | ||
索引缓存 | 支持 | 支持 | 支持 | 支持 | 支持 |
数据可压缩 | 支持 | ||||
空间使用 | 高 | 低 | N/A | 低 | 低 |
内存使用 | 高 | 低 | 中等 | 低 | 高 |
批量插入速度 | 低 | 高 | 高 | 高 | 高 |
支持外键 | 支持 |
- 重点:InnoDB、MyISAM
- 了解:MEMORY、MERGE
1、InnoDB(MySQL 的默认存储引擎)
InnoDB 存储引擎提供了具有提交、回滚、崩溃恢复能力的事务安全。但是对比 MyISAM 的存储引擎,InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保留数据和索引。
InnoDB 存储引擎不同于其他存储引擎的特点 :
事务控制
外键约束
MySQL 支持外键的存储引擎只有 InnoDB ,在创建外键的时候,要求父表必须有对应的索引,子表在创建外键的时候,也会自动的创建对应的索引。
在创建索引时,可以指定在删除、更新父表时,对子表进行的相应操作,包括 RESTRICT、CASCADE、SET NULL 和 NO ACTION。
- RESTRICT 和 NO ACTION相同, 是指限制在子表有关联记录的情况下, 父表不能更新;
- CASCADE 表示父表在更新或者删除时,更新或者删除子表对应的记录;
- SET NULL 则表示父表在更新或者删除的时候,子表的对应字段被 SET NULL 。
示例:
-- 建立两张表中,country_innodb是父表,country_id为主键索引,city_innodb表是子表,country_id字段为外键,对应于country_innodb表的主键country_id CONSTRAINT `fk_city_country` FOREIGN KEY(country_id) REFERENCES country_innodb(country_id) ON DELETE RESTRICT ON UPDATE CASCADE
针对上面创建的两个表, 子表的外键指定是 ON DELETE RESTRICT ON UPDATE CASCADE 方式的:
- 在主表删除记录的时候, 如果子表有对应记录, 则不允许删除;
- 主表在更新记录的时候, 如果子表有对应记录, 则子表对应更新 。
外键信息查看 :
show create table city_innodb ;
存储方式
InnoDB 存储表和索引有以下两种方式 :
- 使用共享表空间存储, 这种方式创建的表的表结构保存在 .frm 文件中, 数据和索引保存在 innodb_data_home_dir 和 innodb_data_file_path 定义的表空间中,可以是多个文件。
- 使用多表空间存储, 这种方式创建的表的表结构仍然存在 .frm 文件中,但是每个表的数据和索引单独保存在 .ibd 中。
2、MyISAM
MyISAM 不支持事务、也不支持外键,其优势是访问的速度快,对事务的完整性没有要求或者以 SELECT、INSERT 为主的应用基本上都可以使用这个引擎来创建表 。
特点:
- 不支持事务
- 文件存储方式
- 每个 MyISAM 在磁盘上存储成 3 个文件,其文件名都和表名相同,但拓展名分别是 :
- .frm (存储表定义)
- .MYD(MYData , 存储数据)
- .MYI(MYIndex , 存储索引)
3、MEMORY
Memory 存储引擎将表的数据存放在内存中。每个 MEMORY 表实际对应一个磁盘文件,格式是 .frm,该文件中只存储表的结构,而其数据文件,都是存储在内存中,这样有利于数据的快速处理,提高整个表的效率。MEMORY 类型的表访问非常地快,因为数据是存放在内存中的,并且默认使用 HASH 索引, 但是服务一旦关闭,表中的数据就会丢失。
4、MERGE
MERGE存储引擎是一组 MyISAM 表的组合,这些 MyISAM 表必须结构完全相同,MERGE 表本身并没有存储数据,对MERGE类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的 MyISAM 表进行的。
对于 MERGE 类型表的插入操作,是通过 INSERT_METHOD 子句定义插入的表,可以有 3 个不同的值,使用FIRST 或 LAST 值使得插入操作被相应地作用在第一或者最后一个表上,不定义这个子句或者定义为NO,表示不能对这个MERGE表执行插入操作。
可以对MERGE表进行 DROP 操作,但是这个操作只是删除MERGE表的定义,对内部的表是没有任何影响的。
创建和使用 MERGE 表的示例 :
创建3个测试表:order_1990、order_1991、order_all,其中 order_all 是前两个表的 MERGE 表; 分别向两张表中插入记录; 往 order_all 中插入一条记录 ,由于在 MERGE 表定义时,INSERT_METHOD 选择的是 LAST,那么插入的数据会向最后一张表中插入。
-- order_all 表的引擎 engine = merge union = (order_1990,order_1991) INSERT_METHOD=LAST default charset=utf8;
存储引擎的选择
在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。以下是几种常用的存储引擎的使用环境。
- InnoDB : 是 Mysql 的默认存储引擎,用于事务处理应用程序,支持外键。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询以外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。InnoDB存储引擎除了有效的降低由于删除和更新导致的锁定, 还可以确保事务的完整提交和回滚,对于类似于计费系统或者财务系统等对数据准确性要求比较高的系统,InnoDB是最合适的选择。
- MyISAM : 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
- MEMORY:将所有数据保存在 RAM 中,在需要快速定位记录和其他类似数据环境下,可以提供几块的访问。MEMORY 的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,其次是要确保表的数据可以恢复,数据库异常终止后表中的数据是可以恢复的。MEMORY 表通常用于更新不太频繁的小表,用以快速得到访问结果。
- MERGE:用于将一系列等同的 MyISAM 表以逻辑方式组合在一起,并作为一个对象引用他们。MERGE 表的优点在于可以突破对单个 MyISAM 表的大小限制,并且通过将不同的表分布在多个磁盘上,可以有效的改善 MERGE 表的访问效率。这对于存储诸如数据仓储等 VLDB 环境十分合适。