区块链基础-哈希(hash)是啥
如果你从事编程,或者对区块链感兴趣,那么哈希这个词肯定经常听到,那么哈希到底是什么,今天就简单聊一聊。
首先我有一个算法,有一个输入和一个输出,换句话说当你输入一个数据,我返回给你一个数据。我们假定一下我的算法是 +1,然后算法的输入和输出都是数字,当你输入一个数字时,我返回给你一个数字,那么根据我这个算法,我们就知道,当你输入一个数字时,输出的一定是另外一个数字,因为我输出的数字是在你的基础上加一,而且我们也知道没有最大的数字(不考虑计算机能使用的最大数值),这样就有一个明显的特点:输入的数据不同,输出的数据一定不同。
这只是哈希的一个特点,并且我上面的例子并不是非常确定,首先上面的例子,当我知道输出的数据是什么的时候,我可以推算出输入的数据是什么。这样是非常不安全的,如果哈希算法是这样,那么也就没有用了。那么下一个特点就出来了:根据输出结果,不能计算出输入结果。就是说在上一个特点的基础上,我们不仅让输出的数据唯一,而且输出的数据不能在推算出输入数据。
在我们第一个例子中,我们输出的数字大小是无限的,也就是说,输出的数据的长度不是固定的,而且是根据你输入的数据来改变的。这也不是我们想要的。那么另外一个特点就出来了:输出的数据是固定长度。举个例子,在之前的例子中,我们输入1,输出2,输入10,输出11。在保持新的特点时,就可能是这样,输入1,输出:164728798263,输入2,输出:875730978359。不仅输出的数据不固定了,而且长度也固定了。
不知道根据上面的例子大家有没有发现另外一个特点,当我输入1和输入2时,输出的两个数据差距非常大,不错,这也是一个特点:输入的两个数据差别不大时,输出的数据差距非常大。大家可能会想,那我如果输入两个差距很大的数据,那么输出的差别是不是就很小了?当然不是,这个特点主要是说,无论你输入什么数据,只要是不同的,输出的数据肯定不同,而且差别很大。
hash
不知道大家有没有想过,当我们输出的数据定长,并差距很大,而且根据输入数据唯一时,那么会不会发生碰撞,就是说当我输入两个数据时,有没有可能输出两个相同的数据。从数学上来说,这是一定可能发生的,当我们定长时,那么输出的数据一定是有限的,假如我们输出的数据个数是n,那么当我们输入了n+1次不同的数据时,那么肯定有两个是相同的,这是一定的。但是在现实中这是不可行的,因为如果我们要做n+1次操作的话,如果使用计算机来操作,很有可能是需要几十年甚至几百年的。想一下 ipv6,可以让世界上每一粒沙子都配一个ip,大概就是这个意思了。
怎么样,哈希没有那么难吧,理解起来非常简单,但是实现起来就不简单了,目前有很多的算法:MD4,MD5,SHA 家族等等,都是为了实现哈希,但是 MD5 已经完成碰撞了。好在现在我们不需要实现这个算法了,只需要知道如何使用就可以了,如果想要认识区块链,那么哈希一定是第一步。
感谢阅读,祝大家生活愉快!