[译]C语言实现一个简易的Hash table(4)

qingsongzdq

2019-06-30

[译]C语言实现一个简易的Hash table(4)

上一章我们解释了Hash table中最重要的hash函数，并用伪代码和C语言实现了一个我们自己的hash函数，hash函数中碰撞是无法避免的，当发生碰撞时我们改如何有效的处理呢？这章我们就来讲解下。

处理碰撞

hash函数中将无限大的输入映射到有限的输出中，当不同的输入映射到相同的输出时，就会发生碰撞，每个的hash表都会采用不同的方法来处理碰撞。

我们的哈希表将使用一种称为开放地址的双重哈希的技术来处理冲突。双重哈希使用两个散列函数来计算在发生碰撞后存储记录的索引。

双重哈希

当i发生碰撞后我们使用如下方式来获取索引：

index = hash_a(string) + i * hash_b(string) % num_buckets

当没有发生碰撞时，i=0，所以索引就是hash_a的值，发生碰撞后，hash_a的结果就需要经过一次hash_b的处理。

hash_b可能会返回0，将第二项减少到0，这就导致hash表会将多个记录插入到同一个bucket中，我们可以在hash_b的结果后加1来处理这种情况，确保它永远不会为0：

index = (hash_a(string) + i * (hash_b(string) + 1)) % num_buckets

算法实现

// hash_table.c
static int ht_get_hash(const char* s, const int num_buckets, const int attempt) {
    const int hash_a = ht_hash(s, HT_PRIME_1, num_buckets);
    const int hash_b = ht_hash(s, HT_PRIME_2, num_buckets);
    return (hash_a + (attempt * (hash_b + 1))) % num_buckets;
}

上一章：hash函数
下一章：完成Hash表API

hash函数 c语言 hash table

qingsongzdq

0 关注 0 粉丝 0 动态

相关推荐

php hash算法实现memcached分布式

Mysql是通过SQL语句管理“磁盘中”的文件，Memcached是通过客户端发送的命令管理“内存中缓存”的数据。需要缓存的对象或数据以 key/value 对的形式保存在服务器端，key的值通过hash进行转换，把value传递到对应的具体的某台服务器上

jkzyx 2020-06-29

mysql对于很长的字符列的索引方案

SELECT * FROM urlT WHERE url_hash = hash AND url = ‘www.blog.csdn.net‘;

TNTMysql工程师 2020-06-16

加解密原理

密钥，一般就是一个字符串或数字，在加密或者解密时传递给加密或解密算法，以使算法能够正确对明文加密或者对密文解密。对称加密算法的特点是加密使用的密钥和解密使用的密钥是相同的。因此对称加密算法要保证安全性的话，密钥自然要做好保密，只能让使用的人知道，不能对外公

natloc 2020-06-10

webpack 中，hash、chunkhash、contenthash 的区别是什么？

Webpack 有非常多的概念，很多名词长得都差不多。我把这些分散在文档和教程里的内容总结起来，写了一份 webpack 中的易混淆知识点，目前看是全网独一份，大家可以加个收藏，方便以后检索和学习。首先来个背景介绍，哈希一般是结合 CDN 缓存来使用的。如

SelinaChan 2020-05-18

python3 一致性hash算法

client_ip_list = ["113.88.97.173", "106.11.154.33", "207.46.13.149","42.156.137.120", &q

ladysosoli 2020-01-19

9.算法之顺序、二分、hash查找

我们在这里将仅关注成员是否存在这个问题。这个过程产实现的搜索即为顺序查找。　　- 顺序查找原理剖析：从列表中的第一个元素开始，我们按照基本的顺序排序，简单地从一个元素移动到另一个元素，直到找到我们正在寻找的元素或遍历完整个列表。在顺序查找中，当我们与第一个

Happyunlimited 2020-01-12

布隆过滤器(Bloom Filter)与Hash算法

　　Hash算法在应用中又称为指纹或者摘要算法,是一种将任意长度的明文串映射为较短的数据串的算法，目前的Hash算法主要是MD5系列算法与SHA系统算法。但是将映射的Hash值限制在数组大小的范围内，会造成大量的Hash冲突，从而导致性能的急速下降，所以人

yedaoxiaodi 2020-01-08

HashMap源码分析

HashMap 主要用来存放键值对，它基于哈希表的Map接口实现，是常用的Java集合之一。JDK1.8 之前 HashMap 底层是数组和链表结合在一起使用也就是链表散列。所谓扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就

mbcsdn 2020-01-07

python hash

　　Hash，一般翻译做“散列”，也有直接音译为”哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯

lixiaotao 2020-01-03

HashMap、lru、散列表

HashMap的数据结构：HashMap实际上是一个数组和链表的数据结构。底层就是一个数组结构，数组中的每一项又是一个链表。hashCode是一个对象的标识，Java中对象的hashCode是一个int类型值。发生碰撞后会把相同hashcode的对象放到同

hanyujianke 2020-01-01

MySQL 索引结构 hash 有序数组

Hash本身是一种函数，又被称为散列函数。不过在有大量重复值得情况下，hash索引的效率极低，因为要频发地处理Hash冲突。对于Hash索引的联合索引，是将联合索引字段值相捆绑然后计算Hash值的，无法利用对单一字段的Hash值。当字段的重复度低，而且经常

wangshuangbao 2020-07-05

面试必看！凭借着这份 MySQL 高频面试题，我拿到了京东，字节的offer！

本文主要受众为开发人员,所以不涉及到MySQL的服务部署等操作,且内容较多,大家准备好耐心和瓜子矿泉水.前一阵系统的学习了一下MySQL,也有一些实际操作经验,偶然看到一篇和MySQL相关的面试文章,发现其中的一些问题自己也回答不好,虽然知识点大部分都知道

weiguoxin 2020-06-11

PHP弱类型hash比较缺陷

0e在比较的时候会将其视作为科学计数法，所以无论0e后面是什么，0的多少次方还是0。　　$a = $_POST[‘pwd‘];在已知管理员密码md5值是以0e开头的前提下,观察代码逻辑,如果是使用"=="判断即可直接传入md5值是0e开

JF0 2020-01-24

一致性哈希算法 CARP 原理解析, 附 Golang 实现

在后端服务开发的过程中, 遇到了这样一个问题: 需要在 mysql 前面部署 redis 做一层缓存, 要求 redis 是集群部署, 并且每台 redis 节点只缓存总数据量的 1/N, N 为 redis 的个数.所以必须想一种办法来应对上述的情况,

码墨 2020-01-18

字典的key都可以是什么

一个对象能不能作为字典的key，就取决于其有没有__hash__方法。所以所有python自带类型中，除了list、dict、set和内部至少带有上述三种类型之一的tuple之外，其余的对象都能当key。比如数值/字符串/完全不可变的元祖/函数/类/方法/

chouliqingke 2019-12-17

Hash算法：双重散列

　　双重散列是线性开型寻址散列中的冲突解决技术。双重散列使用在发生冲突时将第二个散列函数应用于键的想法。　　来进行双哈希处理。hash1() 和 hash2() 是哈希函数，而 TABLE_SIZE是哈希表的大小。当发生碰撞时，我们通过重复增加步长i 来

Happyunlimited 2019-12-08

mysql 一些小问题

关于MySQL的索引,曾经进行过一次总结,文章链接在这里 Mysql索引原理及其优化.索引是一种数据结构,可以帮助我们快速的进行数据的查找.索引的数据结构和具体存储引擎的实现有关, 在MySQL中使用较多的索引有Hash索引,B+树索引等,而我们经常使用的

翡翠谷 2019-11-11

这可能是史上最全的MySQL面试题分享了，看完直接收藏

前言本文主要受众为开发人员,所以不涉及到MySQL的服务部署等操作,且内容较多,大家准备好耐心和瓜子矿泉水.前一阵系统的学习了一下MySQL,也有一些实际操作经验,偶然看到一篇和MySQL相关的面试文章,发现其中的一些问题自己也回答不好,虽然知识点大部分都

AwesomeQA 2019-08-07

100道MySQL常见面试题总结

本文主要受众为开发人员,所以不涉及到MySQL的服务部署等操作,且内容较多,大家准备好耐心和瓜子矿泉水.前一阵系统的学习了一下MySQL,也有一些实际操作经验,偶然看到一篇和MySQL相关的面试文章,发现其中的一些问题自己也回答不好,虽然知识点大部分都知道

MYSQL轻松学 2019-08-06

一致性Hash算法

一致性Hash算法在1997年由麻省理工学院提出的一种分布式哈希实现算法，设计目标是为了解决因特网中的热点问题，初衷和CARP十分相似。一致性Hash修正了CARP使用的简单哈希算法带来的问题，使得分布式哈希可以在P2P环境中真正得到应用。很多哈希算法都能

KDF000 2019-10-18

qingsongzdq

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号