3.6.8 Calculating Visits Per Day
首先要说明以下几个函数
bit_count:
就是计算二进制里有多少个1
10的二进制是1010
bit_count(10) = 2
100的二进制是1100100
bit_count(123) = 3
bit_or:
按位或,就是如果两边一个位置上存在1,那这个位置就为1
拿上面10和100举例
10 | 100 转换为二进制就是 1010|1100100
1010
1100100
1101110
1<<day:
向左位移,向左位移几位,然后用0填补
比如day=2
1<<2 = 100
day=4
1<<4 = 10000
回到主题,现在要计算出图中每天的访问量,可以看到day列中是存在重复记录的,所以要去除,一般思路应该会写出以下SQL:
这个的确可以得到正确值,但是官方参考文档里使用了更巧妙的算法
为了演示,现在将day设定为1,2,2,3好了,那就等于
bit_or(1<<1, 1<<2, 1<<2, 1<<3)
10 | 100 | 100 | 1000 =>110 | 100 | 1000 =>110 | 1000 =>1110
当110 | 100的时候,相同的值就不会发生变化,所以最后bit_count的结果就为3
插入2w条数据后,看下执行计划,第一种SQL执行两遍全表扫描
为了明确看到查询性能,我们启用profiling并关闭query cache:
MYSQL没有这样的功能,自增只能每次增加1,我们只可以控制初值为多少,无法指定增长规律。但是你的这个需求比较特殊,你可以使用系统功能产生一个1、2、3....这有点自增列(例如id),你需要列值实际上是一个计算字段(2^(id-1)):2的id-1次方
MYSQL可以使用移位运算,例如:
SELECT id,2<<(id-1) FROM tab
文件格式支持行格式
特性
antelope
(innodb-base)
row_format=compact
row_format=redundant
compact和redumdant的区别在就是在于首部的存存内容区别。
compact的存储格式为首部为一个非null的变长字段长度列表
redundant的存储格式为首部是一个字段长度偏移列表(每个字段占用的字节长度及其相应的位移)。
在antelope中对于变长字段,低于768字节的,不会进行overflow
page存储,某些情况下会减少结果集io.
barracuda
(innodb-plugin)
row_format=dynamic
row_format=compressed
这两者主要是功能上的区别功能上的。
另外在行里的变长字段和antelope的区别是只存20个字节,其它的overflow
page存储。
另外这两都需要开启innodb_file_per_table=1
(这个特性对一些优化还是很有用的)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)