HashSet的数据结构为哈希表
哈希表的组成:数组+链表+红黑树(在jdk8之前:数组+链表)
哈希值:
对象的整数表现形式(获取哈希值的方法:调用hashCode()方法,一般情况下,会重写hashCode()方法,利用对象内部的属性值计算哈希值)
对象的哈希值特点:
1.如果没有重写hashCode()方法,不同对象计算出的哈希值是不同的
2.如果已经重写hashcode方法,不同的对象只要属性值相同,计算出的哈希值就是一样的
3.但是在小部分情况下,不同的属性值或者不同的地址值计算出来的哈希值也有可能一样。(哈希碰撞)
HashSet的底层原理:
1.创建一个默认长度16,默认加载因子0.75的数组,数组名table
2.哈希表添加元素的的方式不是从0索引开始挨个添加,根据元素的哈希值跟数组的长度计算出应存入的位置
int index = (数组长度-1) & 哈希值;
3.判断应存入的位置是否为null,如果是null直接存入
4.如果应存入的位置不为null,表示有元素,则调用equals方法比较属性值
如果属性值一样:不存
如果属性不一样:存入数组,形成链表,新元素直接挂在老元素下面(JDK8以前:新元素存入数组,老元素挂在新元素下面)
扩容机制:
当数组存了(当前数组长度*加载因子)的长度时,数组长度就会变成原来的两倍
比如:1.当前数组长度默认为16,当数组存了12的长度时,数组长度就会变成32
2.当前数组长度为32,当数组存了24的长度时,数组长度就会变成64
当链表长度大于8而且数组长度大于等于64时会自动转为红黑树
如果HashSet集合中存储的是自定义对象,必须要重写hashCode和equals方法
HashSet是
1.无序的
2.不允许重复元素
3.允许使用null元素
4.线程不安全的
LinkedHashSet是HashSet的子类
它的数据结构也是哈希表,只不过它的链表为双向链表,可以记录存储的顺序
LinkedHashSet是
1.有序的
2.不重复的