
通俗来讲,哈希值就是文件的身份z,不过比身份z还严格。他是根据文件大小,时间,类型,创作者,机器等计算出来的,很容易就会发生变化,谁也不能预料下一个号码是多少,也没有更改他的软件。哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的。
有这样一种情境,有三万张我们要均匀放置于三个缓存服务器上
简单的做法是对缓存的key进行哈希计算,得到的值进行取模计算,所得到的余数,便是缓存的服务器编号
hash % 机器数 = 余数
当机器数为3时无论值为多少,其余数永远只有0,1,2三种情况
那么根据余数,我们给服务器进行编号s0,s1,s2,余数为0的放置于s0服务器上,1,2同理。
这样我们就将三万张的缓存均分成三份存放与三台缓存服务器中
因为对同一张进行哈希计算时,所得到的哈希值是不变的,所以当需要访问时,只要再次进行哈希计算和取模计算,就能获取到存放于哪台服务器,便可以去该服务器中查找满足了我们的需求。而这种算法也称之为哈希算法
这其中有一个问题,那便是如果我增加一台服务器呢
可以预见的是,当增加一台服务器服务器数变成了4而余数也出现了4种情况
这时向s2的服务器查询时,无法读取到,这导致了程序无法从缓存服务器中读取数据,这时程序就会向后端服务器请求,而大量的缓存同时失效,会导致所有请求都指向后端服务器,这会引起后端服务器的崩溃。
这是就要引入一致性哈希算法
还是同样的三个缓存服务器,这次我们将哈希值对2 32取模,所得到的数一定是1到2 32之间的一个整数
然后我们想像一个圆环,其上的每一个点都代表1到2^32之间的一个整数,而这个圆环也被称为hash环
之后我们对服务器A进行取模计算,这样算出来的整数肯定在1到2^32之间,将这个整数代表为服务器A,并且我们可以将这个整数映射到哈希环上,同样的道理我们处理另外两个服务器,这时三个服务器都被映射到了哈希环上,对于我们也将他映射到哈希环上
那么我们只要从的哈希值开始,沿顺时针在哈希环上查找,遇到的第一个服务器便是缓存所在的服务器
这时哪怕新添加一个服务器在哈希环上,我门所丢失的缓存数据也只是新添加的服务器到逆时针方向遇到的第一个服务器这部分数据,而这样仍然有大部分缓存在缓存服务器中可以被查找到,这样可以帮助后端服务器分担大部分压力,不会使服务器崩溃,而这部分丢失的缓存数据,之后重新在后端加载便可以了
这又引入了另一个问题,哈希偏斜
我们无法确保三个服务器在哈希环上为均分的状态,很有可能其中一台服务器分到了很大部分而另两台分到了很少的部分,这样同样会有后端服务器崩溃的隐患
我们可以添加很多虚拟结点同一个服务器我们分出许多虚拟节点,映射在哈希环上,哈希环上的节点越多,缓存被均分的概率便越大,这样可以尽可能的保证缓存在服务器上是接近理想均分的状态,避免了哈希偏斜的问题
电信A贵州2021021926820210219968
电信A澳门2021753820217533
电信B北京202961991332029601332021060202021061481
电信C重庆61128128686112819268
电信F福建202101115552188515799
电信G甘肃202100646861178093
电信G广东202961288620296128166202961341332029612868
电信G广西2021032246820210322568
电信G贵州202981926720298198167
电信H海南202100192682021001998
电信H河北21915032132
电信H黑龙江219150321322191460130219147198230
电信H河南219150150150222888888222858585
电信H湖北2021030682021032468202103011720210344150
电信H湖南22017001820210396686118791182201706468最低40G的,价格还要看地区、 *** 作系统、网络类型、网络带宽、cpu、内存、开通时间。
如果你买国内的windows,不额外收费,买海外的就额外收费。
如果你买1v1g,和2v2g肯定是有差价的
带宽5m以下一般是1m加价十几块钱,超过5m就三十多块钱,超过10m每m加价就更高了。
最便宜的一个月应该是70多。1m带宽,40G硬盘,1v处理器,1g内存。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)