MySQL前缀索引

MySQL前缀索引,第1张

前缀索引顾名思义,定义字符串的一部分当做索引,而不是把整个字符串当做索引。默认地,如果你创建索引的语句不指定前缀长度,那么索引就会包含整个字符串。

假设一张表有 id,name,email 2个字段

1.创建email列的普通索引应该是: alter table T add index idx_email1( email )

2.前缀索引的创建规则为: alter table table T add index idx_email2( email(6) )

当然第一索引包含是的整个字符串,第二个是该字段前6个字节(注意是字节)

对于这2中索引,B+树怎么存储呢?

INSERT INTO T (email) VALUES ('瞎子','zhangsh1234@163.com'), ('剑圣','lisi1998883@163.com'), ('露娜','zhangssxyz@163.com'), ('李白','zhangsy1998@163.com'), ('韩信','zhaq5481993@163.com'), ('百里玄策','hhaq5481993@163.com')

【谁还不是个野王啊】

普通索引存储为:

是的你没看错,前缀索引那颗树上的存储的是email的前6位字节,也就是你创建前缀索引时指定的前缀字节长度。2种树相比,前缀索引存储了更少的数据,那么他所耗费的空间也就相比较少,这正是他的一个优点。同样的也就相对的增加了扫描行数。

什么增加了扫描行数???? 这是为什么呢?

那么小朋友咱们一起来看下吧。

假设SQL如此这般: select id,name,email from T where email = 'zhangsh1234@163.com'

那么这2个SQL,应该怎么 *** 作呢。

idx_email1:

2.到主键上查到主键为ID1的,判断email值是否正确【为什么判断呢,其实我理解是为了二次判断保证数据一致性吧,比较官方的解释尚未找到】,正确放入结果集

3.取 idx_email1 索引树上刚刚查到的位置的下一条记录,如此往复。

循环过程中,需要回主键取1次数据,所以系统可以认为只扫描了一行【1次是数第一棵树数出来的】

idx_email2:

1.从 索引数上找到满足索引值为 'zhangs'的该记录,取得 ID1的值

2.到主键上查到主键值是 ID1 的行,判断出 email 的值是’ zhangsh1234@xxx.com ’,这行记录放入结果集【不是要的值,丢弃,进行下一步】

3.取 idx_email2 上刚刚查到的位置的下一条记录,重复以上步骤

在这个过程中,要回主键索引取 3 次数据,也就是扫描了 3 行。通过这个对比,你很容易就可以发现,使用前缀索引后,可能会导致查询语句读数据的次数变多。

但是,对于这个查询语句来说,如果你定义的 idx_email2 不是 email(6) 而是 email(8),也就是说取 email 字段的前 8 个字节来构建索引的话,即满足前缀’zhangsh’的记录只有一个,也能够直接查到 ID1,只扫描一行就结束了。也就是说使用前缀索引,定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。

那么问题来了,到底定义多长才算是合理呢?

一般的定义原则是 count(distinct(columnName))/count(*) ,当前缀索引【count(distinct(columnName(length))),length是你想要创建列的前缀字节长度】越接近此值越好,当有多个前缀字节都一样且都等于这个值时怎么选择呢,当然是 字节越少越好了哈,字节越少越省空间。索引选取的越长,占用的磁盘空间就越大,相同的数据页能放下的索引值就越少,搜索的效率也就会越低。

count(distinct(columnName(length))) 翻译到SQL 为: count(dictinct(left(colunmName, length)))

前面我们说了使用前缀索引可能会增加扫描行数,这会影响到性能。其实,前缀索引的影响不止如此,我们再看一下另外一个场景。

来呀,上SQL: select id,email from T where email='zhangsh1234@163.com'

如果按照email全字段索引,那么此SQL 是不需要回表的【为什么不需要回表?兄嘚,这个相当于覆盖索引了哈】

那么如果按照前缀索引是否需要回表呢?答案是的。

因为当判断前6个字节相等后,需要拿到id 回表拿到email的全部内容进行比较,如果不相同,丢弃这行,否则加入结果集。

那么有人会问了,我把长度放大点,包含所有字节不就好了吗?

那么此时会有如下问题。

1.当你此时的长度是囊括了全字段,但是系统是不知道的,他还是需要回表再次判断的,去确定前缀索引的定义是否截断了完整信息。

2.此时长度是够了,那么能肯定因为业务日后不会增加长度吗?

3.尽可能的加长长度,还不如直接建立全字段索引呢

综上,使用前缀索引就用不上覆盖索引对查询性能的优化了,这也是你在选择是否使用前缀索引时需要考虑的一个因素。

前面说到的是,可以根据字段前面几个字节进行查询的,那么对于身份z这种,一共 18 位,其中前 6 位是地址码,所以同一个县的人的身份z号前 6 位一般会是相同的。

或许你会说,多弄几个字节不就好吗?那么请问下自己为什么使用前缀索引呢,不就是为了节省空间吗?

那么这么做合适吗? 不合适对吗? 乖~,快去反省下吧

那么采用前缀索引显示是不行的,那么如果用前缀索引怎么办呢,聪明的你应该已经猜到了,采用倒叙存储,然后建立前缀索引。

放到SQL 中就应该是这样的: select field_list from t where id_card = reverse('id_card_string')

当然了,这种逻辑建议放到业务逻辑中实现,而不是放到SQL 中。

按照上述第4节的内容,有人或许会有另一个想法,还倒叙建立前缀索引复杂不,hash索引或者hash字段不香吗?

有人会问了,为什么要在创建一个值来存储hash值呢,如果不存储你知道原值是什么吗? 同时hash算法是有一定重复可能的(hash值碰撞)

【可以了解下partition算法哦:[ https://selfboot.cn/2016/09/01/lost_partition 】。如果重复了,不存储原值,你是无法判断出正确数据的。

注:【hash字段不代表hash索引,hash索引原理正在快马加鞭】,简单说下hash索引,hash索引不需要创建一个值来存储hash值,而是有hasn表来存储【hash值碰撞时,由一个链表来搞定了】,存储的内容为 hash值和每行的行指针

说回来啊,跑题了

查询时: select field_list from t where id_card_crc=crc32('id_card_string') and id_card='id_card_string'

不过有个问题相信你也想到了,不管是hash存储值还是hash索引都是不支持范围查询的。

来总结下这2个优缺点吧

1.从占用空间来看呢,倒叙索引不需要额外开辟存储空间,而hash字段需要额外的一个字段,所以从这点上看倒叙索引更胜一筹,NO!并不准确,如果前缀长度过长,那么这2个情况额外的空间也就相差无几了

3.从查询效率上看,使用 hash 字段方式的查询性能相对更稳定一些。因为 crc32 算出来的值虽然有冲突的概率,但是概率非常小,可以认为每次查询的平均扫描行数接近 1。而倒序存储方式毕竟还是用的前缀索引的方式,也就是说还是会增加扫描行数

1.全字段完整索引比较占空间,但是而走覆盖索引

2.前缀索引,节省空间,但会增加扫描 次数 并且不能使用覆盖索引【每次都需回表校验】

3.倒序存储,再创建前缀索引,用于绕过字符串本身前缀的区分度不够的问题。【倒叙方法建立放到业务逻辑中】

4.hash字段索引,相比前缀索引性能较为稳定,但是有额外的存储空间和计算消耗,同时也 支持范围查询

这是针对MySQL的索引而言。

单个字段索引时,采用该索引字段进行模糊查询时,只有左边没有%时,该索引才其效果。

请点击输入图片描述

在组合索引中,必须按字段顺序写查询条件,否则就会让索引失效,这也是最左前缀原则之一。如下:

请点击输入图片描述

3. MySQL的安装

 MySQL有两种安装方式:源码包安装和二进制包安装。这两种方式各有特色:二位制包安装不需编译,针对不同的平台有经

过优化编译的不同的二进制文件以及包格式,安装简单方便;源码包则必须先配置编译再安装,可以根据你所用的主机环境进行优化,选择最佳的配置值,安装定制

更灵活。下面分别介绍这两种安装方式。

 3.1 源码包方式安装

3.1.1 在linux系统中添加运行Mysql的用户和组

/usr/sbin/groupadd mysql

/usr/sbin/useradd -d /var/lib/mysql -s /sbin/nologin -g mysql mysql

3.1.2 下载最新稳定发行版(GA)的MySQL软件

访问MySQL网站http://dev.mysql.com/downloads/下载最新稳定发行版的MySQL源码包。本文使用的是5.0.51版本,在linux系统下用下面的命令下载:

wget http://mysql.mirror.kangaroot.net/Downloads/MySQL-5.0/mysql-5.0.51.tar.gz

3.1.3 解压缩下载的源码包

首先建立一个工作目录( 笔者建议的目录为/usr/local/src/mysql ) :

mkdir -p /usr/local/src/mysql

将下载的源码包移至工作目录:

mv mysql-5.0.51.tar.gz /usr/local/src/mysql

进入工作目录并用tar命令解压源码包:

cd /usr/local/src/mysql

tar zxvf mysql-5.0.51.tar.gz

命令执行结束后,当前工作目录下将生成一个新的子目录mysql-5.0.51,此目录下即为mysql的源码文件。

3.1.4 配置Makefile文件

进入MySQL源码目录:

cd mysql-5.0.51

执行下面的命令可查看可配置选项:

  ./configure --help

本文使用的配置命令格式如下:

CC=gcc CFLAGS="-O3" CXX=gcc CXXFLAGS="-O3 -felide-constructors

-fno-exceptions -fno-rtti" ./configure

--prefix=/usr/local/mysql --enable-thread-safe-client --enable-assembler

--with-big-tables --with-client-ldflags=-all-static

--with-mysqld-ldflags=-all-static --with-charset=utf8

--with-collation=utf8_general_ci --with-extra-charsets=complex

配置选项说明:

CC:C编译器的名称(用于运行configure),本文示例为gcc

CFLAGS:C编译器的标志(用于运行configure),本文示例为-O3,指定优化级别为3

CXX:C++编译器的名称(用于运行configure),本文示例为gcc

CXXFLAGS:C++编译器的标志(用于运行configure)

  --prefix:指定安装目录,本文示例为/usr/local/mysql

--localstatedir:指定默认数据库文件保存目录,默认为安装目录下的var目录

  --enable-thread-safe-client:编译线程安全版的MySQL客户端库

  --enable-assembler:使用一些字符函数的汇编版本

--with-client-ldflags:客户端链接参数,本文示例为指定静态编译mysql客户端

  --with-mysqld-ldflags:服务器端链接参数,本文示例为指定静态编译mysql服务器

--with-big-tables:在32位平台上支持大于4G行的表

 

--with-charset:指定默认字符集。mysql默认使用latin1(cp1252)字符集,可以使用此选项更改。字符集可以是big5、

cp1251、cp1257、czech、danish、dec8、dos、euc_kr、gb2312、gbk、german1、hebrew、

hp8、hungarian、koi8_ru、koi8_ukr、latin1、latin2、sjis、swe7、tis620、ujis、usa7或

win1251ukr。

--with-collation:指定默认校对规则。mysql默认使用latin1_swedish_ci校对规则,可以使用此选项更改。

  --with-extra-charsets:服务器需要支持的字符集,有三种可能的值:空格间隔的一系列字符集名;complex ,包括不能动态装载的所有字符集;all,将所有字符集包括进二进制。本文示例为complex。

  注意:要想更改字符集和校对规则,要同时使用--with-charset和--with-collation选项。 校对规则必须是字符集的合法校对规则。(在mysql中使用SHOW COLLATION语句来确定每个字符集使用哪个校对规则)。

3.1.5 编译源代码

  执行下面的命令编译源代码:

  make

3.1.6 安装

  执行下面的命令安装mysql到目标路径:

  make install

3.1.7 复制默认全局启动参数配置文件到/etc目录

码方式安装需要手动复制配置文件,配置模板位于源码树的support-files目录,有my-small.cnf、my-medium.cnf、

my-large.cnf、my-huge.cnf四个,选择跟你的环境相接近的一个复制到/etc目录,并做适当修改。关于mysql配置文件的详细信

息请参阅笔者的其它文章或是mysql官方文档。

本文示例选择my-medium.cnf,执行下面的命令将其复制到/etc目录:

cp ./support-files/my-medium.cnf /etc/my.cnf

3.1.8 初始化授权表

执行下面的命令初始化授权表:

  ./scripts/mysql_install_db --user=mysql

3.1.9 更改mysql数据目录属主和权限

默认数据库文件保存目录为安装目录下的var目录,执行configure命令时可通过--localstatedir参数指定不同的目录,本文示例为默认位置。

chown -R mysql.mysql /usr/local/mysql/var

chmod -R 700 /usr/local/mysql/var

3.1.10 设置开机自启动服务控制脚本

执行下面的命令复制启动脚本到资源目录:

cp ./support-files/mysql.server /etc/rc.d/init.d/mysqld

执行下面的命令增加mysqld服务控制脚本执行权限:

chmod +x /etc/rc.d/init.d/mysqld

执行下面的命令将mysqld服务加入到系统服务:

chkconfig --add mysqld

执行下面的命令检查mysqld服务是否已经生效:

chkconfig --list mysqld

命令输出类似下面的结果:

mysqld 0:off 1:off 2:on 3:on 4:on 5:on 6:off

表明mysqld服务已经生效,在2、3、4、5运行级别随系统启动而自动启动,以后可以使用service命令控制mysql的启动和停止。

  启动mysqld服务:

  service mysqld start

停止mysqld服务:

service mysqld stop

执行下面的命令关闭开机自启动:

  chkconfig mysqld off

执行下面的命令可以改变开机自启动的运行级别为3、5:

  chkconfig --level 35 mysqld on

3.1.11 将mysql的bin目录加入PATH环境变量

编辑/etc/profile文件:

vi /etc/profile

在文件最后添加如下两行:

PATH=$PATH:/usr/local/mysql/bin

export PATH

执行下面的命令使所做的更改生效:

. /etc/profile

3.2 二进制包方式安装

 3.2.1 从安装媒体安装

Mysql二进制包已经包含在CentOS 5的安装媒体中,可以直接从安装媒体中安装下面三个rpm包:

mysql-5.0.22-2.1.0.1.i386.rpm

mysql-devel-5.0.22-2.1.0.1.i386.rpm

mysql-server-5.0.22-2.1.0.1.i386.rpm

不同的版本文件名有所不同,请注意区分。

执行下面的命令安装:

rpm -iUvh mysql-5.0.22-2.1.0.1.i386.rpm

rpm -iUvh mysql-devel-5.0.22-2.1.0.1.i386.rpm

rpm -iUvh mysql-server-5.0.22-2.1.0.1.i386.rpm

3.2.2 通过yum安装

如果你安装的机器此时可以连接到互联网,笔者建议使用yum命令来简化安装过程:

yum install mysql-server mysql-devel mysql

yum将自动从centos的镜像站点查找你指明的软件的最新二进制包,并检查软件包依赖关系,安装软件的同时自动安装其依赖的软件包。

3.2.3 从mysql网站下载最新稳定版本的二进制包安装

通过CentOS安装媒体或yum安装的二进制包版本会落后于mysql开发者网站发布的版本,可以从mysql网站下载安装最新稳定版本的mysql。

访问MySQL网站http://dev.mysql.com/downloads/下

载最新稳定发行版的相应硬件平台的MySQL。本文使用的是Red Hat Enterprise Linux 5 RPM (x86)

5.0.45版本。需要下载Server、Client、Headers and Libraries、Share Libraries/Shared

compatibility libraries几个rpm包,其它为可选包,按需要选择。

在linux系统下用下面的命令下载:

wget http://mysql.mirrors.pair.com/Downloads/MySQL-5.0/MySQL-server-community-5.0.45-0.rhel5.i386.rpm

wget http://mysql.mirrors.pair.com/Downloads/MySQL-5.0/MySQL-client-community-5.0.45-0.rhel5.i386.rpm

wget http://mysql.mirrors.pair.com/Downloads/MySQL-5.0/MySQL-devel-community-5.0.45-0.rhel5.i386.rpm

wget http://mysql.mirrors.pair.com/Downloads/MySQL-5.0/MySQL-shared-community-5.0.45-0.rhel5.i386.rpm

wget http://mysql.mirrors.pair.com/Downloads/MySQL-5.0/MySQL-shared-compat-5.0.45-0.rhel5.i386.rpm

执行下面的命令安装:

rpm -iUvh MySQL-server-community-5.0.45-0.rhel5.i386.rpm

rpm -iUvh MySQL-client-community-5.0.45-0.rhel5.i386.rpm

rpm -iUvh MySQL-devel-community-5.0.45-0.rhel5.i386.rpm

rpm -iUvh MySQL-shared-community-5.0.45-0.rhel5.i386.rpm

rpm -iUvh MySQL-shared-compat-5.0.45-0.rhel5.i386.rpm

4. MySQL的配置

4.1 目录结构

 4.1.1 源码包方式安装目录结构

源码包方式安装时通常是在3.1.4节中configure命令的--prefix选项指定的目录中建立如下的目录结构,特殊指定的目录除外:

./bin #mysql用户可执行文件目录

./include/mysql #mysql C头文件目录

./info #mysql 信息文件目录

./lib/mysql#mysql库文件目录

./libexec#mysql后台daemon程序目录

./man #mysql联机帮助文档目录

./mysql-test #mysql测试程序目录

./share/mysql #mysql公用文件目录,包括字符集、配置文件模板、启动脚本、初始化SQL文件等

./sql-bench #mysql压力测试程序目录

/etc/my.cnf#mysql配置文件

/etc/rc.d/init.d/mysqld #mysqld服务启动脚本

4.1.2 RPM二进制包方式安装目录结构

二进制包方式安装时使用系统软件默认目录结构 :

/usr/bin #mysql用户可执行文件目录

/usr/libexec #mysql后台daemon程序目录

/usr/lib/mysql #mysql库文件目录

/usr/lib64/mysql #如果为64系统,mysql 64位库文件目录

/usr/share/doc#mysql文档目录

/usr/share/info#mysql信息文件目录

/usr/share/man #mysql联机帮助文档目录

/usr/share/mysql#mysql字符集目录

/usr/include/mysql #mysql C头文件目录

/var/log #mysqld服务日志文件目录

/var/run/mysqld #mysqld服务运行状态目录

/var/lib/mysql #mysql数据文件目录

/etc/my.cnf #mysql配置文件

/etc/rc.d/init.d/mysqld #mysqld服务启动脚本

4.2 配置文件

Linux

系统下,mysql的配置参数文件为my.cnf,一般按下面的顺序查找此文件:/etc目录、mysql安装目录、mysql数据目录。配置模板位于源

码树的support-files目录,有my-small.cnf、my-medium.cnf、my-large.cnf、my-huge.cnf四

个,关于mysql配置文件的详细信息请参阅笔者的其它文章或是mysql官方文档。

4.3 启动mysqld服务

执行下面的命令启动mysql:

service mysqld start

4.3 设置mysql帐号

mysql安装后默认生成两个帐号:一个是root,未设置密码,可以从本机登录到mysql;另一个是匿名帐号,无帐号名、无密码,可以从本机登录,未提供用户名的连接都将假定为此帐号。这样的设置存在着安全隐患,按下面的步骤进行更改。

以root帐号连接到mysql服务器:

mysql -u root

如果提示找不到mysql文件,请尝试使用绝对路径,如本文示例为:

/usr/local/mysql/bin/mysql -u root

命令成功执行后将进入到mysql命令提示符下:

mysql>

(以下命令均在mysql命令提示符下执行)

改变当前数据库为mysql:

use mysql

设置从本地主机登录的root帐号密码:

set password for root@localhost=password('your password')

或:

update user set password=password('your password') where user='root' and host='localhost'

删除匿名帐号:

delete from user where user=''

删除密码为空的帐号:

delete from user where password=''

删除允许非localhost主机登录的帐号:

delete from user where host<>'localhost'

执行下面的命令使更改生效:

flush privileges

执行下面的命令退出mysql命令行:

quit

或:

/q

5. 结束语

至此,Mysql基本安装完毕。希望本文能对初学者有所帮助。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7624514.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-07
下一篇 2023-04-07

发表评论

登录后才能评论

评论列表(0条)

保存