深入剖析Redis系列： Redis数据结构之哈希

liuweixiao0

2019-05-21

关注关注

前言

大部分编程语言都提供了哈希（hash）类型，它们的叫法可能是哈希、字典、关联数组。在 Redis 中，哈希类型 是指键值本身又是一个 键值对结构。

深入剖析Redis系列： Redis数据结构之哈希

哈希形如 value={ {field1，value1}，...{fieldN，valueN} }，Redis 键值对 和 哈希类型 二者的关系如图所示：

深入剖析Redis系列： Redis数据结构之哈希

哈希类型中的 映射关系 叫作 field-value，这里的 value 是指 field 对应的值，不是键对应的值。

正文

1. 相关命令

1.1. 基本命令

1.1.1. 设置值

hset key field value

下面为 user：1 添加一对 field-value，如果设置成功会返回 1，反之会返回 0。

127.0.0.1:6379&gt; hset user:1 name tom
(integer) 1

此外 Redis 提供了 hsetnx 命令，它们的关系就像 set 和 setnx 命令一样，只不过 作用域 由键变为 field。

1.1.2. 获取值

hget key field

下面操作用于获取 user：1 的 name 域（属性） 对应的值。

127.0.0.1:6379&gt; hget user:1 name
"tom"

如果键或 field 不存在，会返回 nil：

127.0.0.1:6379&gt; hget user:2 name
(nil)
127.0.0.1:6379&gt; hget user:1 age
(nil)

1.1.3. 删除field

hdel key field [field ...]

hdel 会删除 一个或多个 field，返回结果为 成功删除 field 的个数，例如：

127.0.0.1:6379&gt; hdel user:1 name
(integer) 1
127.0.0.1:6379&gt; hdel user:1 age
(integer) 0

1.1.4. 计算field个数

hlen key

例如键 user：1 有 3 个 field：

127.0.0.1:6379&gt; hset user:1 name tom
(integer) 1
127.0.0.1:6379&gt; hset user:1 age 23
(integer) 1
127.0.0.1:6379&gt; hset user:1 city chengdu
(integer) 1
127.0.0.1:6379&gt; hlen user:1
(integer) 3

1.1.5. 批量设置或获取field-value

hmget key field [field ...]

hmset key field value [field value ...]

hmset 和 hmget 分别是 批量设置 和获取 field-value，hmset 需要的参数是 key 和多对 field-value，hmget 需要的参数是 key 和多个 field。例如：

127.0.0.1:6379&gt; hmset user:1 name tom age 12 city chengdu
OK
127.0.0.1:6379&gt; hmget user:1 name city
1) "tom"
2) "chengdu"

1.1.6. 判断field是否存在

hexists key field

例如 user：1 包含 name 域，所以返回结果为 1，不包含时返回 0：

127.0.0.1:6379&gt; hexists user:1 name
(integer) 1

1.1.7. 获取所有field

hkeys key

hkeys 命令应该叫 hfields 更为恰当，它返回指定 哈希键 所有的 field，例如：

127.0.0.1:6379&gt; hkeys user:1
1) "name"
2) "age"
3) "city"

1.1.8. 获取所有value

hvals key

下面操作获取 user：1 的全部 value：

127.0.0.1:6379&gt; hvals user:1
1) "tom"
2) "12"
3) "chengdu"

1.1.9. 获取所有的field-value

hgetall key

下面操作获取 user:1 所有的 field-value：

127.0.0.1:6379&gt; hgetall user:1
1) "name"
2) "tom"
3) "age"
4) "12"
5) "city"
6) "chengdu"

在使用 hgetall 时，如果 哈希元素 个数比较多，会存在阻塞 Redis 的可能。如果开发人员只需要获取部分 field，可以使用 hmget，如果一定要获取全部 field-value，可以使用 hscan 命令，该命令会 渐进式遍历 哈希类型。

1.2. 不常用命令

1.2.1. 键值自增

hincrby key field

hincrbyfloat key field

hincrby 和 hincrbyfloat，就像 incrby 和 incrbyfloat 命令一样，但是它们的 作用域 是 field。

1.2.2. 计算value的字符串长度

hstrlen key field

例如 hget user:1 name 的 value 是 tom，那么 hstrlen 的返回结果是 3。

127.0.0.1:6379&gt; hstrlen user:1 name
(integer) 3

下面是 哈希类型命令 的 时间复杂度，开发人员可以参考此表选择适合的命令。

深入剖析Redis系列： Redis数据结构之哈希

2. 内部编码

哈希类型 的 内部编码 有两种：

2.1. ziplist（压缩列表）

当 哈希类型 元素个数小于 hash-max-ziplist-entries 配置（默认 512 个）、同时 所有值 都小于 hash-max-ziplist-value 配置（默认 64 字节）时，Redis 会使用 ziplist 作为哈希的 内部实现，ziplist 使用更加 紧凑的结构 实现多个元素的 连续存储，所以在 节省内存 方面比 hashtable 更加优秀。

2.2. hashtable（哈希表）

当 哈希类型 无法满足 ziplist 的条件时，Redis 会使用 hashtable 作为哈希的 内部实现，因为此时 ziplist 的 读写效率 会下降，而 hashtable 的读写 时间复杂度 为 O（1）。

下面的示例演示了 哈希类型 的 内部编码，以及相应的变化。

当 field 个数 比较少，且没有大的 value 时，内部编码 为 ziplist：

127.0.0.1:6379&gt; hmset hashkey f1 v1 f2 v2
OK
127.0.0.1:6379&gt; object encoding hashkey
"ziplist"

当有 value 大于 64 字节时，内部编码 会由 ziplist 变为 hashtable：

127.0.0.1:6379&gt; hset hashkey f3 "one string is bigger than 64 byte...忽略..."
OK
127.0.0.1:6379&gt; object encoding hashkey
"hashtable"

当 field 个数超过 512，内部编码 也会由 ziplist 变为 hashtable：

127.0.0.1:6379&gt; hmset hashkey f1 v1 f2 v2 f3 v3 ... f513 v513
OK
127.0.0.1:6379&gt; object encoding hashkey
"hashtable"

3. 适用场景

如图所示，为 关系型数据表 的两条 用户信息，用户的属性作为表的列，每条用户信息作为行。

深入剖析Redis系列： Redis数据结构之哈希

使用 Redis 哈希结构 存储 用户信息 的示意图如下：

深入剖析Redis系列： Redis数据结构之哈希

相比于使用 字符串序列化 缓存 用户信息，哈希类型 变得更加直观，并且在 更新操作 上会 更加便捷。可以将每个用户的 id 定义为 键后缀，多对 field-value 对应每个用户的属性，类似如下伪代码：

public UserInfo getUserInfo(long id) {
 // 用户id作为key后缀
 String userRedisKey = "user:info:" + id;
 // 使用hgetall获取所有用户信息映射关系
 Object userInfoMap = redis.hgetAll(userRedisKey);
 UserInfo userInfo;
 if (userInfoMap != null) {
 // 将映射关系转换为UserInfo
 userInfo = transferMapToUserInfo(userInfoMap);
 } else {
 // 从MySQL中获取用户信息
 userInfo = mysql.get(id);
 // 将userInfo变为映射关系使用hmset保存到Redis中
 redis.hmset(userRedisKey, transferUserInfoToMap(userInfo));
 // 添加过期时间
 redis.expire(userRedisKey, 3600);
 }
 return userInfo;
}

3.1. 哈希结构与关系型表

需要注意的是 哈希类型 和 关系型数据库 有两点不同之处：

哈希类型 是 稀疏的，而 关系型数据库 是 完全结构化的，例如 哈希类型 每个键可以有不同的 field，而 关系型数据库 一旦添加新的列，所有行 都要为其 设置值（即使为 NULL），如图所示：

深入剖析Redis系列： Redis数据结构之哈希

关系型数据库 可以做复杂的 关系查询，而使用 Redis 去模拟关系型复杂查询 开发困难，维护成本高。

3.2. 几种缓存方式

到目前为止，我们已经能够用 三种方法 缓存 用户信息，下面给出三种方案的 实现方法 和 优缺点分析。

3.2.1. 原生字符串类型

给用户信息的每一个属性分配 一个键。

set user:1:name tom
set user:1:age 23
set user:1:city beijing

优点：简单直观，每个属性都支持 更新操作。
缺点：占用 过多的键，内存占用量 较大，同时用户信息 内聚性比较差，所以此种方案一般不会在生产环境使用。

3.2.2. 序列化字符串类型

将用户信息 序列化 后用 一个键 保存。

set user:1 serialize(userInfo)

优点：简化编程，如果合理的使用 序列化 可以 提高内存利用率。
缺点：序列化 和 反序列化 有一定的开销，同时每次 更新属性 都需要把 全部数据 取出进行 反序列化，更新后 再 序列化 到 Redis 中。

3.2.3. 哈希类型

每个用户属性使用一对 field-value，但是只用 一个键 保存。

hmset user:1 name tom age 23 city beijing

优点：简单直观，如果使用合理可以 减少内存空间 的使用。
缺点：要控制和减少哈希在 ziplist 和 hashtable 两种 内部编码 的转换，hashtable 会消耗 更多内存。

小结

本文介绍了 Redis 中的 哈希结构 的一些 基本命令、内部编码 和 适用场景。最后对比了 关系型表 和 哈希结构 的区别，以及几种 存储方式 的优缺点。

参考

《Redis 开发与运维》

数据结构 redis 哈希

安科网

深入剖析Redis系列： Redis数据结构之哈希

liuweixiao0

前言

正文

小结

参考

liuweixiao0

相关推荐

详解Redis数据结构之跳跃表

数据结构之利用PHP实现二分搜索树

泛型和元编程的模型：Java, Go, Rust, Swift, D等

万能Python的秘诀：操纵数据的内置工具

Java实现单链表、栈、队列三种数据结构

Map和Set两种数据结构在ES6的作用

「算法与数据结构」带你看回溯算法之美

比较JavaScript中的数据结构（数组与对象）

学c++需要先学c语言吗？

动图演示：手撸堆栈的两种实现方法！

技术人员思维和认知升级

python的链表基础知识点

数据结构 4

HBase/TiDB都在用的数据结构：LSM Tree，不得了解一下？

编写更简洁的Python代码的5个技巧

盘点 Python 10 大常用数据结构（下篇）

盘点 Python 10 大常用数据结构（上篇）

图解！24张图彻底弄懂九大常见数据结构！原创 Amazing10 业余码农 5月24日

什么是hash?

数据结构--二叉树（Java）

liuweixiao0