redis中的数据结构和编码详解

kaixinfelix

2020-03-27

关注关注

redis中的数据结构和编码：

背景：

1>redis在内部使用redisObject结构体来定义存储的值对象。
2>每种类型都有至少两种内部编码，Redis会根据当前值的类型和长度来决定使用哪种编码实现。
3>编码类型转换在Redis写入数据时自动完成，这个转换过程是不可逆的，转换规则只能从小内存编码向大内存编码转换。

源码：

值对象redisObject：

            typedef struct redisObject {
                unsigned type:4;                /* 对象类型 */
                unsigned encoding:4;            /* 内部编码 */
                unsigned lru:LRU_BITS;     /* lru time (relative to server.lruclock) */
                int refcount;                    /* 引用计数器，内存回收机制就是基于该值实现的 */
                void *ptr;                        /* 若要存储的是整数值则直接存储数据，否则表示指向数据的指针 */
            } robj;

类型type：

说明：查看当前键的类型：type key

            #define OBJ_STRING 0     /*字符串对象*/
            #define OBJ_LIST 1        /*列表对象*/
            #define OBJ_SET 2        /*集合对象*/
            #define OBJ_ZSET 3        /*有序集合对象*/
            #define OBJ_HASH 4        /*哈希对象*/

编码encoding；

说明：查看当前键的编码：object encoding key

            #define OBJ_ENCODING_RAW 0             /*Raw representation 简单动态字符串*/
            #define OBJ_ENCODING_INT 1             /*Encoded as integer long long类型整数*/
            #define OBJ_ENCODING_HT 2            /* Encoded as hash table 字典*/
            #define OBJ_ENCODING_ZIPMAP 3        /* Encoded as zipmap 压缩map*/
            #define OBJ_ENCODING_LINKEDLIST 4     /* Encoded as regular linked list 双端链表*/
            #define OBJ_ENCODING_ZIPLIST 5         /* Encoded as ziplist 压缩列表*/
            #define OBJ_ENCODING_INTSET 6         /* Encoded as intset 整数集合*/
            #define OBJ_ENCODING_SKIPLIST 7     /* Encoded as skiplist 跳跃表*/
            #define OBJ_ENCODING_EMBSTR 8         /* Embedded sds string encoding embstr编码的简单动态字符串*/
            #define OBJ_ENCODING_QUICKLIST 9     /* 基于压缩列表的双端列表实现的快速表*/

最后被访问的时间lru：

            概念：记录对象最后一次被访问的时间。
            说明：
                1>查看当前键的空闲时间(该命令不会更新lru字段)；object idletime key 。可以通过scan + object idletime key 来收集长时间未被访问的数据，然后手动清理。
                2>当配置了maxmemory和maxmemory-policy=volatile-lru或者allkeys-lru时，若内存超过了上限(maxmemory)后，则优先回收长时间没有被访问的数据，从而回收内存。

引用计数器refcount：

概念：记录当前对象被引用的次数，当refcount=0时，可以安全回收当前对象空间。
说明：获取当前对象引用：object refcount key

类型对应的编码：

        字符串：
            int：存放整形值的字符串。
            embstr：存放字符的短字符串(大小不超过44个字节)。
            raw：存放字符的长字符串(大小不超过44个字节)。

            embstr和raw的比较：
                raw调用2次内存分配函数，释放时当然也需要释放两次。
                embstr调用1次内存分配函数，分配一块连续的内存，释放时只需释放一次。

列表(list)：

            压缩列表(ziplist)：
                结构：所有数据都是采用线性连续的内存结构(大致可类比数组)，目的是为了减少内存的占用，追求空间和时间的平衡。
                    1>以O(1)时间复杂度入队和出队。
                    2>读写操作涉及复杂的指针移动，最坏时间复杂度为O(n2)，故列表的元素不易太多。
                    3>新增删除操作涉及内存重新分配，加大了操作的复杂性。

优点：占用内存较少，且占用的是一块连续的内存，故加载的速度相对更快一些。
缺点：当元素的个数较大时，访问元素的时间较长。

应用：

适合存储小对象和长度有限(即使O(n2)的复杂度也不会太大)的数据。
当元素个数小于list-max-ziplist-entries(默认512) 且所有元素值的大小都小于list-max-ziplist-value(默认64字节)时，使用ziplist作为列表的内部实现。

双端链表(linkedlist)：

                优点：元素的个数较多时，访问元素的时间比压缩列表更快一些。
                缺点：因为是双向链表，故维护了前置指针、后置指针等结构，占用了更多的内存，且内存不是连续的，容易产生内存碎片。
                说明：当无法满足ziplist的条件时，使用linkedlist作为列表的内部实现。
                应用：当列表对象元素较多时，压缩列表就会转化为更适合存储大量元素的双端链表。

            注意：只能小内存编码向大内存编码转换。(若当元素增删频繁时，数据向压缩编码转换是非常消耗CPU的，得不偿失)

快速列表(quicklist)：

结构：一个双向链表，链表的每一个节点都是一个ziplist，故quicklist结合了双向链表和压缩列表的优点。
Redis3.2开始，列表采用quicklist进行编码。

哈希(hash)：

压缩列表(ziplist)：

应用：当元素个数小于hash-max-ziplist-entries(默认512) 且所有元素value的大小都小于hash-max-ziplist-value(默认64字节)时，使用ziplist作为哈希的内部实现。

哈希表(hashtable)：

                优点：读写时间复杂度O(1)
                缺点：占用内存较多。
                应用：当无法满足ziplist的条件时，hashtable作为哈希的内部实现。

hash算法：与传统hash算法类似，根据key计算得到在哈希表中的位置，采用单链表解决冲突，达到加载因子时进行扩展，进而引发重哈希。

rehash：采用增量式重哈希：

                概念：在扩容时不会一次性对所有的key进行rehash，而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
                优点：避免由于大量的key在同一时间段进行rehash操作导致服务短暂无响应的问题。
                过程：在增量式的rehash过程中，会使用到两张哈希表：
                    查找：先从老表中查找，再从新表中查找，此外还会对一些key进行rehash操作。
                    新增：新增的键值对添加到新表中。

集合(set)：

            整数集合(intset)：
                结构：有序、不重复的整数集。
                    1>查找时间复杂度为O(logn)
                    2>插入时间复杂度为O(n)
                优点：占用的内存远小于hashtable，
                应用：当元素都是整数且元素个数小于set-max-intset-entries(默认512)时，使用intset作为集合的内部实现。

哈希表(hashtable)：当无法满足intset的条件时，使用hashtable作为集合的内部实现。

有序集合(zset)：

            说明：redis给有序集合中的每个元素设置一个分数(score)作为排序的依据。

            压缩列表(ziplist)：
                应用：当元素个数小于zset-max-ziplist-entries(默认128个) 且每个元素的值都小于zset-max-ziplist-value(默认64字节)时，使用ziplist作为有序集合的内部实现。

            跳跃表(skiplist)：
                结构：跳跃表通过在每个节点中(基于层和跨度等)维持多个指向其它节点的指针来实现快速访问。
                    查找时间复杂度平均O(logn)、最坏O(n)。
                应用：当不满足ziplist条件时，使用skiplist作为内部实现。

内存优化：

        场景：有海量key和value都比较小的数据，在redis中如何存储才更省内存。
        原理：通过大幅减少key的数量来降低内存的消耗。
        实现：在客户端通过分组将海量的key根据一定的策略映射到一组hash对象中，由于value较小，故hash类型的对象会使用占用内存较小的ziplist编码。
            eg：如存在100万个键，可以映射到1000个hash中，每个hash保存1000个元素。

redis 数据结构编码转换

安科网

redis中的数据结构和编码详解

kaixinfelix

kaixinfelix

相关推荐

详解Redis数据结构之跳跃表

快速制作Redis Docker镜像

Go+Vue开发一个线上外卖应用的流程(用户名密码和图形验证码)

Windows安装Redis并添加本地自启动服务的实例详解

Redis客户端及服务端的安装教程详解

Redis中的String类型及使用Redis解决订单秒杀超卖问题

Linux下redis5.0.5的安装过程与配置方法

Redis 的 GeoHash详解

通过kubesphere部署redis的方法

为啥Redis使用pipelining会更快

基于Redis+Lua脚本实现分布式限流组件封装的方法

Redis概述及linux安装redis的详细教程

Redis常用数据类型命令实例汇总

解密Redis助力双11背后电商秒杀系统(推荐)

硬核！15张图解Redis为什么这么快(推荐)

Redis持久化RDB和AOF区别详解

关于使用IDEA的springboot框架往Redis里写入数据乱码问题

Redis 对过期数据的处理方法

redis中scan命令的基本实现方法

详解centos7 yum安装redis及常用命令

kaixinfelix