asc升序排,从123456这样的顺序
desc 降序排,从大到小654321
1.最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c >3 and d = 4 如果建立(a,b,c,d)顺序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。
2.=和in可以乱序,比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式。
3.尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。
4.索引列不能参与计算,保持列“干净”,比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’)。
5.尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可。
1."一个顶三个"。建了一个(a,b,c)的复合索引,那么实际等于建了(a),(a,b),(a,b,c)三个索引,因为每多一个索引,都会增加写 *** 作的开销和磁盘空间的开销。对于大量数据的表,这可是不小的开销!
2.覆盖索引。同样的有复合索引(a,b,c),如果有如下的sql: select a,b,c from table where a=1 and b = 1。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io *** 作。减少io *** 作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一
3.索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select * from table where a = 1 and b =2 and c = 3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W*10%=100w 条数据,然后再回表从100w条数据中找到符合b=2 and c= 3的数据,然后再排序,再分页;如果是复合索引,通过索引筛选出1000w *10% *10% *10%=1w,然后再排序、分页,哪个更高效,一眼便知
Mysql支持的多种数据类型主要有:数值数据类型、日期/时间类型、字符串类型。
1.整数数据类型及其取值范围:
类型
说明
存储需求(取值范围)
tinyint 很小整数 1字节([0~255]、[-128~127])255=2^8-1127=2^7-1
smallint 小整数 2字节(0~65535、-32768~32767) 65535=2^16-1
mediumint 中等 3字节(0~16777215) 16777215=2^24-1
int(integer) 普通 4字节(0~4294967295) 4294967295=2^32-1
bigint 大整数 8字节(0~18446744073709551615)18446744073709551615=2^64-1
浮点数&定点数:
类型名称
说明
存储需求
float 单精度浮点数 4字节
double 双精度浮点数 8字节
decimal 压缩的“严格”定点数 M+2字节
注:定点数以字符串形式存储,对精度要求高时使用decimal较好;尽量避免对浮点数进行减法和比较运算。
2.时间/日期类型:
year范围:1901~2155
time格式:‘HH:MM:SS’(如果省略写,并且没有冒号,则默认最右起2位为秒,再到分,最后到时);
插入系统当前时间:insert into 表名 values(current_date()),(now())
date类型:‘YYYY-MM-DD’;
datetime(日期+时间):‘YYYY-MM-DD HH:MM:SS’或‘YYYYMMDDHHMMSS’,取值范围:‘1000-01-01 00:00:00’~‘9999-12-31 23:59:59’;
timestamp格式同datetime,但在存储时需要4个字节(datetime需要8字节),并且以UTC(世界标准时间)进行存储(即timestamp会随设置的时区而变化,而datetime存储的绝不会变化);timestamp的范围:1970-2037。
3.字符串类型:
text类型:tinytext、text、mediumtext、longtext
类型
范围
tinytext 255=2^8-1
text 65535=2^16-1
mediumtext 16777215=2^24-1
longtext 4294967295=4GB=2^32-1
char的存储需求是定义时指定的固定长度;varchar的存储需求是取决于实际值长度。
set类型格式:set(’值1’,’值2’…) ——可以有0或者多个值,对于set而言,若插入的值为重复的,则只娶一个。插入的值乱序,则自动按顺序插入排列。插入不正常值,则忽略。
二进制类型:
bit(M)——保存位字段值(位字段类型),M表示值的位数;
eg:select BIN(b+0) from 表名;—–b为列名b+0表示将二进制的结果转换为对应的数字的值,BIN()函数将数字转换为二进制。
blog——-二进制大对象,用来存储可变数量的数据。
数据类型
存储范围(字节)
tinyblog 最多255=2^8-1 字节
bolg 最多65535=2^16-1 字节
mediumblog 最多16777215=2^24-1 字节
longblog 最多4294967295=4GB=2^32-1 字节
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)