MySQL字符串索引&脏页刷盘

MySQL字符串索引&脏页刷盘,第1张

字符串加索引的方式?

对于字符串进行添加索引,我们除了对整个字符串加索引以外,还可以添加前缀索引。

什么是前缀索引?

前缀索引的好处?

使用前缀索引,定义好长度,可以做到即节省空间,又不用额外增加太多的查询成本。

前缀索引的弊端?

前缀索引会使覆盖索引失效,额外增加回表的消耗,如果前缀索引的长度选择区分度不高,会额外导致扫描行数增加。

其他给字符串加索引的方式?

什么是脏页?

MySQL在更新数据的时候会写redo log并且更新内存以后就会返回,数据文件并不会立即更新,这就是所谓的WAL机制。

当内存被更新以后,内存中的数据页就会和磁盘上的数据页存在不一致的情况,该内存也就被称为 脏页

内存中的数据被写入磁盘以后,内容变为一致,此时该内存页就被称为干净页。

什么叫刷脏页?

内存数据页中的内容被写入磁盘数据页中的过程称为刷脏页。

什么时候会刷脏页?

InnoDB如何控制刷脏页的频率?

首先确认InnoDB所在主机的IO能力,此时需要用到数据库的innodb_io_capacity参数,该参数推荐设置为磁盘的IOPS。磁盘的IOPS可以通过fio工具进行测试。

InndoDB刷脏页主要考虑以下两个因素:

MySQL会根据F1(M)和F2(N)两个值,取其中较大的值记为R,之后引擎可以按照innodb_io_capacity定义的能力乘以R%来控制刷脏页的速度。

脏页比例

参数innodb_max_dirty_pages_pct是脏页比例的上限,MySQL 8.0中是90%。

当前脏页比例可以通过Innodb_buffer_pool_pages_dirty/Innodb_buffer_pool_pages_total计算获得,具体sql计算指令如下:

连坐机制

InnoDB在刷脏页的时候,如果该脏页旁边的是页也是脏页,会同时把相邻的脏页刷掉。

该刷脏页行为由参数innodb_flush_neighbors控制:

对于机械硬盘,开启连坐会减少随机IO的消耗,但对于SSD,没必要开启该参数。

作为一名程序员,在求职面试时,不知你有没有遇到类似这样的问题。

张工是一名java程序员,最近到一家软件公司应聘软件开发岗位,面试官问了他关于MySql索引这样的一个问题。

对于这个问题张工之前在做项目时也曾遇到,那时候字段明明是加了索引,可不明白为什么还是很慢。后加上引号就正常了,为了赶项目进度,张工也没有再去留意。

现在面试官突然这么一问,张工也说不出个所以然来。

面试官让他回去等通知。

我们知道MySql索引可以加快数据检索速度,这也是使用的索引的最主要原因。但有时候使用不当就会遇到索引失效问题,譬如在MySQL字符串类型查询时不加引号索引会失效,是因为MySQL内部进行了隐式转换。

那为什么会发生隐式转换?又是怎么转换的呢?

今天我们来聊聊关于MySql索引失效的话题。

先来看看一般导致索引失效的有哪些?

如果一张表的索引有多个,要遵守最佳左前缀法则,即查询从索引的最左前列开始并且不跳过索引中的列。

用户表tb_user字段 id,name,age,sex

创建索引为idx_user_name

执行语句:

这时候就会导致索引失效

在索引列上做加工 *** 作,查询时会导致索引失效,从而导致全表扫描。所以,建议不要在索引列上做任何 *** 作。

举个例子,例如订单表tb_order有个索引是dt(日期), 字段数据存放的格式是这样的2021-12-10 这样的,如果有个需求需要根据dt,格式是20220207这样的来查询,这时候就不要对dt进行格式转换了,

这样索引就失效了。

而是应该对 20220207做格式处理

这样dt索引才不会失效。

例如我们在订单表tb_order建立了索引idx_order_id,order_id字段类型为varchar

在查询时如果使用where order_id= 20220207123654100,这样的查询方式会直接造成索引失效。

要让索引生效,正确的用法为

假如有张用户表tb_user,创建的索引为idx_user_name_age_sex_phone 其中name、age、sex都加了索引。

执行语句

上面这条sql语句只会命中name和age索引,sex索引会失效,复合索引失效需要查看key_len的长度。

再来看一个例子:

从这两条SQL执行的结果我们可以看出,执行第一条SQL没有使用到索引,而执行第二条SQL时使用到了索引。这是为什么呢?

我们需要先了解下mysql索引优化器工作的原理。选择索引是优化器工作,优化器工作有自己的一套规则,如果等号两边的数据类型不一致,则会发生隐式转换。

基于这条规则,我们回过头看看

这条SQL语句执行时就会变为

由于对索引列进行了函数 *** 作,所以才导致索引失效,从而全表扫描了。

那么问题来了,细心的你不知有没有留意到为什么是把左侧的列转为int类型,而不是把右侧的值转成字符串类型呢?

什么情况下把数字转为字符串,什么情况下把字符串转为数字,优化器它是根据什么规则来进行判断的?其实规则也并不复杂。

根据这个规则,我们再回过头看看之前的查询语句

select '12345678936' = 12345678936

返回1 所以这时候就把左侧的列值12345678936转成数字。

关于MySql索引失效的问题先简单写到这,建议平时在做项目时还是要多了解下原理,如果你了解其背后的原理,求职面试时和面试官交流起来就会很舒服了,相信能为这次面试加分,提高被录用的概率。

为什么MySQL字符串类型查询时不加引号索引会失效?这是因为要查询的字符串字段没有加引号时,MySQL内部进行了隐式转换,此次查询会导致全表扫描,所以慢了。

总结:

在索引列上进行了函数 *** 作,MySQL内部会进行了隐式转换,导致索引失效,从而产生全表扫描。

由于笔者知识及水平有限,文中错漏之处在所难免,如有不足之处,欢迎交流。

拓展

索引创建

1、主键索引:

2、唯一索引:

3、普通索引:

4、全文索引:

alter table table_name add fulltext (column)

5、联合索引:

索引删除


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/6131209.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-15
下一篇 2023-03-15

发表评论

登录后才能评论

评论列表(0条)

保存