1、redis中的每一个数据库,都由一个redisDb的结构存储。其中,redisDbid存储着redis数据库以整数表示的号码。redisDbdict存储着该库所有的键值对数据。redisDbexpires保存着每一个键的过期时间。
2、当redis服务器初始化时,会预先分配16个数据库(该数量可以通过配置文件配置),所有数据库保存到结构redisServer的一个成员redisServerdb数组中。当我们选择数据库selectnumber时,程序直接通过redisServerdb[number]来切换数据库。有时候当程序需要知道自己是在哪个数据库时,直接读取redisDbid即可。
3、既然我们知道一个数据库的所有键值都存储在redisDbdict中,那么我们要知道如果找到key的位置,就有必要了解一下dict的结构了:
typedefstructdict{
//特定于类型的处理函数
dictTypetype;
//类型处理函数的私有数据
voidprivdata;
//哈希表(2个)
dicththt[2];
//记录rehash进度的标志,值为-1表示rehash未进行
intrehashidx;
//当前正在运作的安全迭代器数量
intiterators;
}dict;
由上述的结构可以看出,redis的字典使用哈希表作为其底层实现。dict类型使用的两个指向哈希表的指针,其中0号哈希表(ht[0])主要用于存储数据库的所有键值,而1号哈希表主要用于程序对0号哈希表进行rehash时使用,rehash一般是在添加新值时会触发,这里不做过多的赘述。所以redis中查找一个key,其实就是对进行该dict结构中的ht[0]进行查找 *** 作。
4、既然是哈希,那么我们知道就会有哈希碰撞,那么当多个键哈希之后为同一个值怎么办呢?redis采取链表的方式来存储多个哈希碰撞的键。也就是说,当根据key的哈希值找到该列表后,如果列表的长度大于1,那么我们需要遍历该链表来找到我们所查找的key。当然,一般情况下链表长度都为是1,所以时间复杂度可看作o(1)。
二、当redis拿到一个key时,如果找到该key的位置。
了解了上述知识之后,我们就可以来分析redis如果在内存找到一个key了。
1、当拿到一个key后,redis先判断当前库的0号哈希表是否为空,即:if(dict-
2、判断该0号哈希表是否需要rehash,因为如果在进行rehash,那么两个表中者有可能存储该key。如果正在进行rehash,将调用一次_方法,_用于对数据库字典、以及哈希键的字典进行被动rehash,这里不作赘述。
3、计算哈希表,根据当前字典与key进行哈希值的计算。
4、根据哈希值与当前字典计算哈希表的索引值。
5、根据索引值在哈希表中取出链表,遍历该链表找到key的位置。一般情况,该链表长度为1。
6、当ht[0]查找完了之后,再进行了次rehash判断,如果未在rehashing,则直接结束,否则对ht[1]重复345步骤。
到此我们就找到了key在内存中的位置了。
肯定是存表好,你100万条数据,占4个G,实际上,数据没占多少,主要是索引空间用占用的。但是这个索引空间,必须要的。不然你查询会很慢。你存文档,空间占用的确是少了。如果只是少量数据。当然不会影响,可是你那一搞百万条,查询速度一定会很慢。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)