mysql索引原理

zjx0

2020-05-10

如何查询表

"""
select
where 
group by
having
distinct
order by
limit 
regexp
like
...
"""

连表操作理论

今日内容详细

前期表准备

create table emp(
  id int not null unique auto_increment,
  name varchar(20) not null,
  sex enum(‘male‘,‘female‘) not null default ‘male‘, #大部分是男的
  age int(3) unsigned not null default 28,
  hire_date date not null,
  post varchar(50),
  post_comment varchar(100),
  salary double(15,2),
  office int, #一个部门一个屋子
  depart_id int
);

#插入记录
#三个部门：教学，销售，运营
insert into emp(name,sex,age,hire_date,post,salary,office,depart_id) values
(‘jason‘,‘male‘,18,‘20170301‘,‘张江第一帅形象代言‘,7300.33,401,1), #以下是教学部
(‘tom‘,‘male‘,78,‘20150302‘,‘teacher‘,1000000.31,401,1),
(‘kevin‘,‘male‘,81,‘20130305‘,‘teacher‘,8300,401,1),
(‘tony‘,‘male‘,73,‘20140701‘,‘teacher‘,3500,401,1),
(‘owen‘,‘male‘,28,‘20121101‘,‘teacher‘,2100,401,1),
(‘jack‘,‘female‘,18,‘20110211‘,‘teacher‘,9000,401,1),
(‘jenny‘,‘male‘,18,‘19000301‘,‘teacher‘,30000,401,1),
(‘sank‘,‘male‘,48,‘20101111‘,‘teacher‘,10000,401,1),
(‘哈哈‘,‘female‘,48,‘20150311‘,‘sale‘,3000.13,402,2),#以下是销售部门
(‘呵呵‘,‘female‘,38,‘20101101‘,‘sale‘,2000.35,402,2),
(‘西西‘,‘female‘,18,‘20110312‘,‘sale‘,1000.37,402,2),
(‘乐乐‘,‘female‘,18,‘20160513‘,‘sale‘,3000.29,402,2),
(‘拉拉‘,‘female‘,28,‘20170127‘,‘sale‘,4000.33,402,2),
(‘僧龙‘,‘male‘,28,‘20160311‘,‘operation‘,10000.13,403,3), #以下是运营部门
(‘程咬金‘,‘male‘,18,‘19970312‘,‘operation‘,20000,403,3),
(‘程咬银‘,‘female‘,18,‘20130311‘,‘operation‘,19000,403,3),
(‘程咬铜‘,‘male‘,18,‘20150411‘,‘operation‘,18000,403,3),
(‘程咬铁‘,‘female‘,18,‘20140512‘,‘operation‘,17000,403,3);


# 当表字段特别多 展示的时候错乱 可以使用\G分行展示
select * from emp\G;

# 个别同学的电脑在插入中文的时候还是会出现乱码或者空白的现象 你可以将字符编码统一设置成GBK

几个重要关键字的执行顺序

# 书写顺序
select id,name from emp where id > 3;
# 执行顺序
from
where
select

"""
虽然执行顺序和书写顺序不一致 你在写sql语句的时候可能不知道怎么写
你就按照书写顺序的方式写sql
	select * 先用*号占位
	之后去补全后面的sql语句
	最后将*号替换后你想要的具体字段
	
	明天会一直使用 这里先理解
"""

where筛选条件

# 作用:是对整体数据的一个筛选操作
# 1.查询id大于等于3小于等于6的数据
select id,name,age from emp where id>=3 and id<=6;
select id,name from emp where id between 3 and 6;  两者等价

# 2.查询薪资是20000或者18000或者17000的数据
select * from emp where salary=20000 or salary=18000 or salary=17000;
select * from emp where salary in (20000,18000,17000);

# 3.查询员工姓名中包含字母o的员工的姓名和薪资
"""
模糊查询
	like
		%  匹配任意多个字符
		_  匹配任意单个字符
"""
select name,salary from emp where name like ‘%o%‘;

# 4.查询员工姓名是由四个字符组成的 姓名和薪资  char_length()   _
select name,salary from emp where name like ‘____‘;
select name,salary from emp where char_length(name) = 4;

# 5.查询id小于3或者id大于6的数据
select * from emp where id not between 3 and 6;

# 6.查询薪资不在20000,18000,17000范围的数据
select * from emp where salary not in (20000,18000,17000);

# 7.查询岗位描述为空的员工姓名和岗位名  针对null不用等号 用is
select name,post from emp where post_comment = NULL;
select name,post from emp where post_comment is NULL;

group by分组

# 分组实际应用场景  分组应用场景非常的多
	男女比例
    部门平均薪资
    部门秃头率
    国家之间数据统计

# 1	按照部门分组
select * from emp group by post;
"""
分组之后 最小可操作单位应该是组 还不再是组内的单个数据
	上述命令在你没有设置严格模式的时候是可正常执行的 返回的是分组之后 每个组的第一条数据 但是这不符合分组的规范:分组之后不应该考虑单个数据 而应该以组为操作单位(分组之后 没办法直接获取组内单个数据)
	如果设置了严格模式 那么上述命令会直接报错 
"""
set global sql_mode = ‘strict_trans_tables,only_full_group_by‘;

设置严格模式之后  分组 默认只能拿到分组的依据
select post from emp group by post;  
按照什么分组就只能拿到分组 其他字段不能直接获取 需要借助于一些方法(聚合函数)


"""
什么时候需要分组啊？？？
	关键字 
		每个 平均 最高 最低 
	
	聚合函数
		max
		min
		sum
		count
		avg
"""
# 1.获取每个部门的最高薪资
select post,max(salary) from emp group by post;
select post as ‘部门‘,max(salary) as ‘最高薪资‘ from emp group by post;
select post ‘部门‘,max(salary) ‘最高薪资‘ from emp group by post;
# as可以给字段起别名 也可以直接省略不写 但是不推荐 因为省略的话语意不明确 容易错乱

# 2.获取每个部门的最低薪资
select post,min(salary) from emp group by post;
# 3.获取每个部门的平均薪资
select post,avg(salary) from emp group by post;
# 4.获取每个部门的工资总和
select post,sum(salary) from emp group by post;
# 5.获取每个部门的人数
select post,count(id) from emp group by post;  # 常用 符合逻辑
select post,count(salary) from emp group by post;
select post,count(age) from emp group by post;
select post,count(post_comment) from emp group by post;  null不行

# 6.查询分组之后的部门名称和每个部门下所有的员工姓名 
# group_concat不单单可以支持你获取分组之后的其他字段值 还支持拼接操作
select post,group_concat(name) from emp group by post;
select post,group_concat(name,‘_DSB‘) from emp group by post;
select post,group_concat(name,‘:‘,salary) from emp group by post;
# concat不分组的时候用 
select concat(‘NAME:‘,name),concat(‘SAL:‘,salary) from emp;

# 补充 as语法不单单可以给字段起别名 还可以给表临时起别名
select emp.id,emp.name from emp;  
select emp.id,emp.name from emp as t1;   报错
select t1.id,t1.name from emp as t1;

# 查询每个人的年薪  12薪
select name,salary*12 from emp;

分组注意事项

# 关键字where和group by同时出现的时候group by必须在where的后面
where先对整体数据进行过滤之后再分组操作
where筛选条件不能使用聚合函数
select id,name,age from emp where max(salary) > 3000;

select max(salary) from emp;  # 不分组 默认整体就是一组

# 统计各部门年龄在30岁以上的员工平均薪资
	1 先求所有年龄大于30岁的员工
    	select * from emp where age>30;
    2 再对结果进行分组
     	select * from emp where age>30 group by post;
    
    select post,avg(salary) from emp where age>30 group by post;

having分组之后的筛选条件

"""
having的语法根where是一致的
只不过having是在分组之后进行的过滤操作
即having是可以直接使用聚合函数的
"""
# 统计各部门年龄在30岁以上的员工平均工资并且保留平均薪资大于10000的部门
select post,avg(salary) from emp 
		where age>30 
    	group by post
        having avg(salary) > 10000
        ;

distinct去重

"""
一定要注意 必须是完全一样的数据才可以去重！！！
一定不要将逐渐忽视了 有逐渐存在的情况下 是不可能去重的
[
{‘id‘:1,‘name‘:‘jason‘,‘age‘:18},
{‘id‘:2,‘name‘:‘jason‘,‘age‘:18},
{‘id‘:3,‘name‘:‘egon‘,‘age‘:18}
]
ORM  对象关系映射   让不懂SQL语句的人也能够非常牛逼的操作数据库
表								类
一条条的数据						对象
字段对应的值						对象的属性

你再写类 就意味着在创建表
用类生成对象 就意味着再创建数据
对象点属性 就是在获取数据字段对应的值
目的就是减轻python程序员的压力 只需要会python面向对象的知识点就可以操作MySQL
"""
select distinct id,age from emp;
select distinct age from emp;

order by排序

select * from emp order by salary;
select * from emp order by salary asc;
select * from emp order by salary desc;
"""
order by默认是升序  asc 该asc可以省略不写
也可以修改为降序     desc
"""
select * from emp order by age desc,salary asc;
# 先按照age降序排  如果碰到age相同 则再按照salary升序排

# 统计各部门年龄在10岁以上的员工平均工资并且保留平均薪资大于1000的部门,然后对平均工资降序排序
	select post,avg(salary) from emp 
		where age>10 
    	group by post
        having avg(salary) > 1000
        order by avg(salary) desc
        ;

limit限制展示条数

select * from emp;
"""针对数据过多的情况 我们通常都是做分页处理"""
select * from emp limit 3;  # 只展示三条数据

select * from emp limit 0,5;
select * from emp limit 5,5;
第一个参数是起始位置
第二个参数是展示条数

正则

select * from emp where name regexp ‘^j.*(n|y)$‘;

多表操作

前期表准备

#建表
create table dep(
id int,
name varchar(20) 
);

create table emp(
id int primary key auto_increment,
name varchar(20),
sex enum(‘male‘,‘female‘) not null default ‘male‘,
age int,
dep_id int
);

#插入数据
insert into dep values
(200,‘技术‘),
(201,‘人力资源‘),
(202,‘销售‘),
(203,‘运营‘);

insert into emp(name,sex,age,dep_id) values
(‘jason‘,‘male‘,18,200),
(‘egon‘,‘female‘,48,201),
(‘kevin‘,‘male‘,18,201),
(‘nick‘,‘male‘,28,202),
(‘owen‘,‘male‘,18,203),
(‘jerry‘,‘female‘,18,204);

表查询

select * from dep,emp;  # 结果   笛卡尔积
"""
了解即可 不知道也没关系
"""

select * from emp,dep where emp.dep_id = dep.id;

"""
MySQL也知道 你在后面查询数据过程中 肯定会经常用到拼表操作 
所以特地给你开设了对应的方法
	inner join  内连接
	left join   左连接
	right join  右连接
	union		全连接
"""
# inner join  内连接
select * from emp inner join dep on emp.dep_id = dep.id;
# 只拼接两张表中公有的数据部分

# left join   左连接
select * from emp left join dep on emp.dep_id = dep.id;
# 左表所有的数据都展示出来 没有对应的项就用NULL

# right join  右连接
select * from emp right join dep on emp.dep_id = dep.id;
# 右表所有的数据都展示出来 没有对应的项就用NULL

# union		全连接  左右两表所有的数据都展示出来
select * from emp left join dep on emp.dep_id = dep.id
union
select * from emp right join dep on emp.dep_id = dep.id;

子查询

"""
子查询就是我们平时解决问题的思路
	分步骤解决问题
		第一步
		第二步
		...
将一个查询语句的结果当做另外一个查询语句的条件去用
"""
# 查询部门是技术或者人力资源的员工信息
	1 先获取部门的id号
    2 再去员工表里面筛选出对应的员工
    select id from dep where name=‘技术‘ or name = ‘人力资源‘;
    
    select name from emp where dep_id in (200,201);
    
    
    select * from emp where dep_id in (select id from dep where name=‘技术‘ or name = ‘人力资源‘);

表的查询结果可以作为其他表的查询条件
也可以通过起别名的方式把它作为一个张虚拟表根其他表关联

"""
多表查询就两种方式
	先拼接表再查询
	子查询 一步一步来
"""

mysql索引 mysql

zjx0

0 关注 0 粉丝 0 动态

关注关注

MySql索引使用策略分析

(建立索引会占用磁盘空间的索引文件。2.很少数据的列也不应该建立索引,比如一个性别字段 0或者1,在查询中,结果集的数据占了表中数据行的比例比较大,mysql需要扫描的行数很多,增加索引,并不能提高效率

moyekongling 2020-11-13

导致MySQL索引失效的一些常见写法总结

最近一直忙着处理原来老项目遗留的一些SQL优化问题，由于当初表的设计以及字段设计的问题，随着业务的增长，出现了大量的慢SQL，导致MySQL的CPU资源飙升，基于此，给大家简单分享下这些比较使用的易于学习和使用的经验。这次的话简单说下如何防止你的索引失效。

liuweiq 2020-09-09

MyISAM与InnoDB索引实现对比详解

MyISAM引擎使用B+Tree作为索引结构，叶节点的data域存放的是数据记录的地址。这里设表一共有三列，假设我们以Col1为主键，则上图是一个MyISAM表的主索引示意。虽然InnoDB也使用B+Tree作为索引结构，但具体实现方式却与MyISAM截然

chenjiazhu 2020-09-29

MySQL索引的各种类型

索引是数据库存储引擎用于快速查找到指定数据的一种数据结构。可以用新华字典做类比：如果新华字典中对每个字的详细解释是数据库中表的记录，那么按部首或拼音等排序的目录就是索引，使用它可以让我们快速查找的某一个字详细解释的位置。在MySQL中，存储引擎也是用了类似

silencehgt 2020-09-07

MySQL索引的基本语法

索引是排好序的数据结构！可以用在 where 条件查找的字段，和order by 排序的字段，有了索引，便可以快速地定位数据所在的物理地址并找出来。ALTER TABLE 表名 ADD INDEX 索引名 ;ALTER TABLE 表名 DROP INDE

mrandy 2020-08-15

mysql 14 覆盖索引+回表

MySQL可以利用索引返回select列表中的字段值。而不必根据主键再次读取聚簇索引数据文件查到数据，也就是平时所说的不需要回表操作。覆盖索引其实是索引覆盖的意思，索引字段就已经囊括select查询的字段，即索引字段覆盖了需查询的字段。t; 即id是聚集索

Accpcjg 2020-08-02

MySQL中的不可见索引、倒序索引

大多数MySQL索引在BTREE中存储

写程序的赵童鞋 2020-07-18

MySQL 索引结构 hash 有序数组

Hash本身是一种函数，又被称为散列函数。不过在有大量重复值得情况下，hash索引的效率极低，因为要频发地处理Hash冲突。对于Hash索引的联合索引，是将联合索引字段值相捆绑然后计算Hash值的，无法利用对单一字段的Hash值。当字段的重复度低，而且经常

wangshuangbao 2020-07-05

MySQL索引原理

　　1.B+树的叶子节点包含了所有的数据；　　2.叶子节点可以直接访问其他叶子节点，不需要回到根节点；　　操作系统中，默认的是每一页是4KB；而InnoDB存储引擎，默认每一页是16KB；　　UserRecord（行记录）区域，保存的是真正的数据，会包含多

bluetears 2020-07-05

MySQL索引索引分类最左前缀原则覆盖索引索引下推联合索引顺序

索引就是帮助RDBMS高效获取数据的数据结构。索引可以让我们避免一行一行进行全表扫描。普通索引 INDEX或者key index_name 没有任何约束，一张表可以有多个普通索引。唯一索引 UNIQUE INDEX index_name 在不同索引

bendan 2020-07-04

MySql索引失效的十大杂症

最近生产爆出一条慢sql，原因是用了or和!于是，总结了索引失效的十大杂症，希望对大家有帮助，加油。如果它一开始就走全表扫描，直接一遍扫描就完事。mysql是有优化器的，处于效率与成本考虑，遇到or条件，让索引失效，看起来也合情合理嘛。在联合索引中，查询条

minggehenhao 2020-07-04

数据库索引过长(Specified key was too long; max key length is 767 bytes)

在新建数据库或者导入别人的数据库脚本的时候会出现Specified key was too long; max key length is 767 bytes错误。这是由于数据库建立索引的时候索引的数据过长导致的。我发现报错的那张表建立了一个varchar

AngelicaA 2020-07-04

MySQL优化之索引篇: Explain工具

explain专门用来做SQL语句的调优的，在select语句前面加一个explain可以把SELECT的执行过程都列出来，包括哪些用了索引，哪些没用索引，哪些查询是全表查询，哪些是索引查询等 . 使用效果如下图 :. 执行编号，标识select所属的行。

minggehenhao 2020-06-21

1071 -Specified key was too long; max key length is 767 bytes

执行下面语句报1071 -Specified key was too long; max key length is 767 bytes. 这是因为数据库表采用utf8编码，其中varchar的column进行了唯一键索引而mysql默认情况下单个列的索引

TMD咯MySQL 2020-06-16

导致索引失效的情况

——按需取数据用多少取多少。

淮南草 2020-06-16

mysql对于很长的字符列的索引方案

SELECT * FROM urlT WHERE url_hash = hash AND url = ‘www.blog.csdn.net‘;

TNTMysql工程师 2020-06-16

MySQL 索引失效

mysql 再使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描。全列匹配我最爱，最左前缀要遵守；带头大哥不能死，中间兄弟不能断；索引列上少计算，范围之后全失效；LIKE百分写最右，覆盖索引不写星；不等空值还有or，索引失效要少用；

Iamready 2020-06-14

MySQL索引介绍

索引类似大学图书馆建书目索引，可以提高数据检索的效率，降低数据库的IO成本。MySQL在300万条记录左右性能开始逐渐下降，虽然官方文档说500~800w记录，所以大数据量建立索引是非常有必要的。MySQL提供了Explain，用于显示SQL执行的详细信息

variab 2020-06-14

Mysql索引类型与基本用法实例分析

是最基本的索引，它没有任何限制。与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。一般是在建表的时候同时创建主键索引。主要用来查找文本中的关键字，而不是直接与索引中的值相比较。fulltext索引配合

MySQL源氏boy 2020-06-14

MySQL8新特性之降序索引底层实现详解

大家可能对索引比较熟悉，而对降序索引比较陌生，事实上降序索引是索引的子集。上面sql的意思是在t1表中，针对b,c,d三个字段创建一个联合索引。asc表示的是升序，使用这种语法创建出来的索引叫做升序索引。在Mysql8中，Collation字段的结果为D,

mengtianyalll 2020-06-14

安科网

mysql索引原理

zjx0

今日内容详细

前期表准备

几个重要关键字的执行顺序

where筛选条件

group by分组

分组注意事项

having分组之后的筛选条件

distinct去重

order by排序

limit限制展示条数

正则

多表操作

表查询

子查询

zjx0

相关推荐

MySql索引使用策略分析

导致MySQL索引失效的一些常见写法总结

MyISAM与InnoDB索引实现对比详解

MySQL索引的各种类型

MySQL索引的基本语法

mysql 14 覆盖索引+回表

MySQL中的不可见索引、倒序索引

MySQL 索引结构 hash 有序数组

MySQL索引原理

MySQL索引索引分类最左前缀原则覆盖索引索引下推联合索引顺序

MySql索引失效的十大杂症

数据库索引过长(Specified key was too long; max key length is 767 bytes)

MySQL优化之索引篇: Explain工具

1071 -Specified key was too long; max key length is 767 bytes

导致索引失效的情况

mysql对于很长的字符列的索引方案

MySQL 索引失效

MySQL索引介绍

Mysql索引类型与基本用法实例分析

MySQL8新特性之降序索引底层实现详解

zjx0