(2)其实长度最好的是(2^n)-1
因为计算机是二进制计算的,1 bytes = 8 bit ,一个字节最多可以代表的数据长度是2的8次方 11111111 在计算机中也就是-128到127
而varchar类型存储变长字段的字符类型,当存储的字符串长度小于255字节时,其需要1字节的空间,当大于255字节时,需要2字节的空间。
使用2 ^ n长度是更好的磁盘或内存块对齐。对齐块更快。今天“块”的大小更大,内存和磁盘足够快,可以忽略对齐,对于非常大的块来说是非常重要的。
所以使用(2^n)-1 可以更好的利用磁盘空间和内存,使数据库可以在最大限度内存储更多的数据
HashMap为了存取高效,要尽量较少碰撞,就是要尽量把数据分配均匀,每个链表长度大致相同,这个实现就在把数据存到哪个链表中的算法;这个算法实际就是取模,hash%length,计算机中直接求余效率不如位移运算,源码中做了优化
hash%length==hash&(length-1)的前提是length是2的n次方;
为什么这样能均匀分布减少碰撞呢?2的n次方实际就是1后面n个0,2的n次方-1 实际就是n个1;
例如长度为9时候,3&(9-1)=0 2&(9-1)=0 ,都在0上,碰撞了;
例如长度为8时候,3&(8-1)=3 2&(8-1)=2 ,不同位置上,不碰撞;
其实就是按位“与”的时候,每一位都能 &1 ,也就是和1111……1111111进行与运算
2的n次方一定是最高位1其它低位是0,这样减1的时候才能得到01111这样都是1的二进制,只有全是1,进行按位与才是最均匀的,因为1与上任何数都等于任何数本身,当然如果不考虑效率直接求余即可(就不需要要求长度必须是2的n次方了)
本人这个领域工作10多年,没有听说过数据库字段最好要设置成2的N次方这种说法。相信现在的数据库系统和CPU缓存机制早就做了优化,上层设计数据模型的时候根本无须考虑这些,尽管根据业务需要来定义字段长度吧。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)