java散列表的系统散列表的目的是

转载

mob64ca14092155 2023-08-14 19:14:05

文章标签 java散列表的系统散列表散列函数字符串 文章分类 Java 后端开发

散列表的定义

在查找数据对象时，由函数h对给定值key计算出地址，将key与该地址单元中数据对象关键字进行比较，确定查找是否成功。因此，散列法又称为“关键字-地址转换法”。散列方法中使用的计算函数称为散列函数（也称哈希函数），按这个思想构造的表称为散列表，所以它是一种存储方法。

装填因子

一般情况下，设散列表空间大小为m，填入表中的元素个数是n,则称α=n/m为散列表的装填因子，例如大小为17，元素为11，装填因子为0.65.实用时，常见散列表大小设计使得α=0.5~0.8为宜。

同义词

映射到同一散列地址上的关键字称为同义词

散列函数的构造方法

一个“好”的散列函数一般应考虑下列两个因素：

计算简单，以便提高转换速度
关键词对应的地址空间分布均匀，以尽量减少冲突。即对于关键词集合中的任何一个关键字，经散列函数映射到地址集合中任何一个地址的概率是基本相等的。

数字关键词的散列构造

直接定址法

java散列表的系统散列表的目的是_散列函数

这类函数计算简单，分布均匀，不会产生冲突，但要求地址集合与关键词集合大小相同，因此，对于较大的关键词集合不适用。所以在现实应用中并不常用

除留取余法

现实应用中比较常用的方法是除留取余法。假设散列表长为TableSize(TableSize的选取，通常由关键词集合的大小n和允许最大装填因子α决定，一般将TableSize取为n/α),选择一个正整数p<=TableSize,散列函数为：

h(key)=key mod p

即取关键词除以p的余数作为散列地址。使用除留取余法，选取合适的p很重要，一般选取p为小于或等于散列表长TableSize的某个最大素数比较好。用素数求得的余数作为散列地址，比较均匀分布在整个地址空间上的可能性较大。

java散列表的系统散列表的目的是_字符串_02

数字分析法

java散列表的系统散列表的目的是_java散列表的系统_03

这种方法的核心就是利用数字的随即部分产生散列值

字符串关键词的散列函数构造

对于字符串类型的关键词，因为字符串的比较比整数的比较要花费更大的代价，所以通过散列函数计算，把字符串映射到整数后再比较也是散列方法的优势之一。

ASCII码加和法

java散列表的系统散列表的目的是_散列函数_04

这种的方法核心是将ascii码字符与散列表长取mod，冲突比较明显，比如：tea与eat 单词换换位置，散列值却相同。

前3个字符移位法

java散列表的系统散列表的目的是_散列函数_05

若忽略空格符不计，则前3位所有可能的不同组合有26^3=17 576种，似乎TableSize=10 007是个不错的选择，但是英文单词也是有规则，最多3 000种变换，装填因子过小，也是浪费。因此，虽然很容易计算，但是当散列表太大的时候，这个函数还是不合适的。

移位法

java散列表的系统散列表的目的是_散列函数_06

这种方法将所有的字符进行移位做散列，很容易产生前几位溢出 。一般用这种方法时，是不使用整个字符串，而是从中选择若干有代表性的字符进行映射。 比如字符串长度大小大于12的时候，仅选取奇数位置上的字符来实现散列函数。

处理冲突的方法

开放定址法

java散列表的系统散列表的目的是_散列表_07

而di的选取又有如下几种方案

线性探测

java散列表的系统散列表的目的是_散列函数_08

java散列表的系统散列表的目的是_散列表_09

在做插入的时候，最尴尬的就是30，与11取模等于8，也就是把这个位置，因为29存的是时候与7产生冲突，所以存在本应30村的地方，后面不断发生冲突，最后30只能跑到1中。真的非常扎心，这种线性探测会带来一定的麻烦。可能会出现很多元素在相邻的散列地址上“堆积”起来的现象，会大大降低查找效率。 解决这种问题的方法是，可采用其他探测法。