前言
案例取自极客时间《mysql45讲》
案例
模拟执行器分析查询语句
场景复现
奇了怪了,此时没用索引,进行了全表扫描
虽然使用了索引,但是还是扫描了37116行,不妨结合之前的知识分析一下:
1.另一个事务未提交,需要保存之前的数据的数据版本,因此delete10万行数据实际是标记数据,这样每一行数据就有两个数据版本,旧的是delete之前的,新的是标记为delete的,索引a上的数据有两份
2.那还多出来的1万7呢,之前介绍过索引树的叶子节点存的是主键,select * 还要进行回表查询,这里将回表的扫描行数一并算上
为什么会选错索引
选择索引是优化器的工作,优化器要找到最优的执行方案并选择最小的代价去执行,扫描行数是影响执行代价之一(扫描越小,访问磁盘次数越少,消耗CPU资源越少)
mysql执行语句之前需要通过根据信息来统计记录数
这个统计信息就是索引的区分度,即索引上不同的值越多,区分度越高越好(show index t 的 cardinality字段查看),索引的区分度是利用采样统计得到的即取小部分统计信息再乘以整体。
除了使用统计信息,还会计算回表代价(主键不需要回表)
如果是统计信息不对那就修正
另一种场景复现
按理说这是个空集,利用索引a只扫描1000行,利用索引b要扫描50000行,这里优化器竟然选择了索引b!!
mysql又选错了索引
解决办法
2.引导使用a索引
我们知道索引树上的数据是有序的,优化器使用b索引,一方面是认为索引b可以避免排序 ,order by a,b强制按照a,b排序意味着两个都需要排序,因此扫描行数成了影响决策的主要条件
3.删掉索引b
解决mysql选错索引主要有两大方向
1.强制指定索引
2.干涉优化器选择(比如增大limit数量,增加order by ,写成子查询)
MySQL选错索引导致的线上慢查询事故
mysql中走与不走索引的情况汇集(待全量实验)
Hello,写的语言格式有些丑
练习题目:
3、多表连接(等值连接)
②为表起别名
# ③添加筛选条件
# 案例:查询 工资>5000 的工种名和员工名、工资
④添加分组和筛选
#01 案例:查询每个部门的员工个数和部门名
⑤排序
#01 案例:查询每个部门的员工个数和部门名
⑥ 三表连接
# 案例:查询员工名、部门名和所在城市
4、多表连接(等值连接)练习
传统模式的多表连接
1. 显示所有员工的姓名,部门号和部门名称。
2. 查询90 号部门员工的job_id 和90 号部门的location_id
3. 选择所有有奖金的员工的last_name , department_name , location_id , city
----------- 三表连查
4. 选择city 在Toronto 工作的员工的
last_name , job_id , department_id , department_name ----------- 三表连查
5. 查询每个工种、每个部门的部门名、工种名和最低工资 ----------- 三表连查
6. 查询每个国家下的部门个数大于2 的国家编号
5、非等值查询
2.非等值连接
#案例1:查询员工的工资以及对应的工资级别
#案例2:查询名字中第三个字符为a,第五个字符为e的员工的工资以及对应的工资级别
6、内连接
#案例1 :查询员工名、部门名
案例2:查询有奖金的员工名、部门名
案例3:查询城市名、员工名和部门名
9、练习
一、查询编号>3的女神的男朋友信息,如果有则列出详细,如果没有,用null填充
#二、查询哪个城市没有部门
三、查询部门名为SAL或IT的员工信息
#四、选择指定员工的姓名,员工号,以及他的管理者的姓名和员工号,结果类似于下面的格式
/*
employees Emp# manager Mgr#
kochhar 101 king
100
*/
10、单行子查询
案例1:谁的工资比Abel高
①查询Abel的工资
②查询员工的信息满足工资>①的结果
案例2:题目:返回job_id与141号员工相同,salary比143号员工多的员工 的姓名,job_id 和工资
①查询141的job_id
②查询143的salary
③查询 姓名,job_id 和工资,满足job_id=①并且salary>②
案例3:返回公司工资最少的员工的last_name,job_id和salary
①查询最低工资
②查询员工的last_name,job_id和salary满足 salary=①
案例4:查询最低工资大于50号部门最低工资的部门id和其最低工资
①查询50号部门的最低工资
②查询每个部门的最低工资
③筛选最低工资>①
11、多行子查询
二、多行子查询
案例1:返回location_id是1400或1700的部门中的所有员工姓名
①查询location_id是1400或1700的部门编号
②查询department_id满足①结果的员工姓名
案例2:返回其它部门中比job_id为‘IT_PROG’部门任意工资低的员工的员
工号、姓名、job_id 以及salary
①查询job_id为‘IT_PROG’部门工资
②返回其它部门中,工资<any ①的结果
题目:返回其它部门中比job_id为‘IT_PROG’部门所有工资都低的员工
#的员工号、姓名、job_id 以及salary
12、子查询练习题
#1. 查询和Zlotkey 相同部门的员工姓名和工资
#2. 查询工资比公司平均工资高的员工的员工号,姓名和工资。
#①查询公司平均工资
② 查询工资>①的员工的员工号,姓名和工资。
#3. 查询各部门中工资比本部门平均工资高的员工的员工号, 姓名和工资
①查询各部门的平均工资
②查询员工的员工号, 姓名和工资,满足本部门并且工资>①
4. 查询姓名中包含字母u 的员工在相同部门的员工的员工号和姓名
①查询姓名中包含字母u的员工的部门
② 部门=①的员工的员工号和姓名
5. 查询在部门的location_id 为1700 的部门工作的员工的员工号
①查询loaction_id =1700的部门编号
② 查询员工号,满足部门号=①
#6. 查询管理者是King 的员工姓名和工资
①查询员工名是king的编号
#② 查询员工姓名和工资,领导的编号=①
#7. 查询工资最高的员工的姓名,要求first_name 和last_name 显示为一列,列名为 姓. 名
①查询最高工资
②查询姓名,工资=①
14、子查询巩固练习
# 1 、查询工资最低的员工信息
#①查询公司的最低工资
②查询员工信息,满足 salary=①
2. 查询平均工资最低的部门信息
①查询每个部门的平均工资
②查询①结果中avg(salary) 字段中的最低值
# ③查询部门编号,满足平均工资= ②结果
④查询部门信息,满足 department_id= ③
3*. 查询平均工资最低的部门信息和该部门的平均工资
4. 查询平均工资最高的 job 信息
①查询每个job的平均工资
②查询①结果中的 avg(salary)的最高值
③查询每个工种的平均工资,满足 平均工资=②
④工种表和③连接 , 查询平均工资最高的 job 信息
# 5. 查询平均工资高于公司平均工资的部门有哪些?
#①查询公司的平均工资
②查询每个部门的平均工资,并且平均工资>①
6. 查询平均工资最高的部门的 manager 的详细信息:
①查询平均工资最高的部门编号
②查询部门编号=①的manager的详细信息
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)