Java list map set 区别 java中list和map

转载

温柔一刀 2023-07-17 20:52:41

文章标签 java hashmap List 数组数据结构 文章分类 Java 后端开发

java中list和map详解
一、概叙

List , Set, Map都是接口，前两个继承至Collection接口，Map为独立接口，

List下有ArrayList，Vector，LinkedList

Set下有HashSet，LinkedHashSet，TreeSet

Map下有Hashtable，LinkedHashMap，HashMap，TreeMap

Collection接口下还有个Queue接口，有PriorityQueue类

注意：Queue接口与List、Set同一级别，都是继承了Collection接口。LinkedList既可以实现Queue接口,也可以实现List接口.Queue接口窄化了对LinkedList的方法的访问权限（即在方法中的参数类型如果是Queue时，就完全只能访问Queue接口所定义的方法了，而不能直接访问 LinkedList的非Queue的方法）。

二、详解

1. List 存储有序,可重复.

a.ArrayList

优点: 底层数据结构是数组，查询快，增删慢。

缺点: 线程不安全，效率高

b.LinkedList

优点: 底层数据结构是链表，查询慢，增删快。

缺点: 线程不安全，效率高

c.Vector

优点: 底层数据结构是数组，查询快，增删慢。

缺点: 线程安全，效率低

三种list的选择(元素可重复)：要安全？

是：Vector

否：ArrayList或者LinkedList

查询多？：ArrayList

增删多？：LinkedList

知道要用List，但是不知道是哪个List，就用ArrayList。

ArrayList是基于动态的数组的数据结构 LinkedList是基于链表的数据结构

（1）ArrayList的实现原理

ArrayList继承AbstractList类，实现了List和RandomAccess，Cloneable, Serializable接口，底层是基于动态的数组。底层使用数组实现,默认初始容量为10.当超出后，会自动扩容为原来的1.5倍，即自动扩容机制。List list = Collections.synchronizedList(new ArrayList(…))即可线程安全。源码解析如下。

（2）LinkedList的实现原理

LinkedList继承AbstractList类，实现了List，Serializable，Queue接口，LinkedList是通过双向链表去实现的，既然是链表实现那么它的随机访问效率比ArrayList要低，顺序访问的效率要比较的高。每个节点都有一个前驱（之前前面节点的指针）和一个后继（指向后面节点的指针）。源码解析如下。

https://www.jianshu.com/p/ea5b7dd7dc01

2. Set存储无序，唯一

set保证里面元素的唯一性其实是靠两个方法，一是equals()和hashCode()方法先是判断set集合中是否有与新添加数据的hashcode值一致的数据，如果有，那么将再进行第二步调用equals方法再进行一次判断，假如集合中没有与新添加数据hashcode值一致的数据，那么将不调用eqauls方法。

a.HashSet

底层数据结构是哈希表。(无序,唯一)

使用Set集合都是需要去掉重复元素的, 如果在存储的时候逐个equals()比较, 效率较低,哈希算法提高了去重复的效率, 降低了使用equals()方法的次数，HashSet调用add()方法存储对象的时候, 先调用对象的hashCode()方法得到一个哈希值, 然后在集合中查找是否有哈希值相同的对象，如果没有哈希值相同的对象就直接存入集合，如果有哈希值相同的对象, 就和哈希值相同的对象逐个进行equals()比较,比较结果为false就存入, true则不存

b.LinkHashSet

底层数据结构是链表和哈希表。(FIFO插入有序,唯一)

由链表保证元素有序，由哈希表保证元素唯一

c.TreeSet

底层数据结构是红黑树。(唯一，有序)

利用自然排序和比较器排序

根据比较的返回值是否是0来决定来保证元素的唯一性。

Set的选择(元素唯一)：排序？

是：TreeSet或LinkedHashSet

否：HashSet

知道要用Set，但是不知道是哪个Set，就用HashSet。

2. Map接口

Map接口有三个比较重要的实现类，分别是HashMap、HashTable和TreeMap。

TreeMap是有序的，HashMap和HashTable是无序的。

Hashtable的方法是同步的，HashMap的方法不是同步的。这是两者最主要的区别。

Hashtable是线程安全的，HashMap不是线程安全的。

HashMap效率较高，Hashtable效率较低。查看Hashtable的源代码就可以发现，除构造函数外，Hashtable的所有 public 方法声明中都有 synchronized关键字，而HashMap的源码中则没有。

Hashtable不允许null值，HashMap允许null值（key和value都允许）

父类不同：Hashtable的父类是Dictionary，HashMap的父类是AbstractMap

HashMap和ConcurrentHashMap的区别

HashMap的实现原理：

用一个数组来存储元素，但是这个数组存储的不是基本数据类型。HashMap实现巧妙的地方就在这里，数组存储的元素是一个Entry类，这个类有三个数据域，key、value（键值对），next(指向下一个Entry)

HashMap通过算法实现的：没有对hash表的长度取余而使用了位运算来得到位置下标，由key的哈希值对数组的长度位运算得到即h & (length-1)

两个不同key经过key.hashCode()&(length-1)计算后得到相同的数组下标，hashmap在插入元素的时候，会首先检查这个位置上有没有元素，如果已经有了元素，那么就把这个新插入的Entry的next指向本来这个位置上的元素的地址，然后再插入这个位置，这也就是为什么插入多个相同的key的value时，这个位置的value始终是最后插入的那个元素的值。

两个相同的Key如何解决：如果相等则进行覆盖，并返回原来的值。

为什么用位运算定位hash桶以及HashMap的扩容都是以2的次方来进行？

假设当前table的length是15，二进制表示为1111，那么length-1就是1110，此时有两个hash值为8和9的key需要计算索引值，计算过程如下：

的二进制表示：1000
　　　　8&（length-1）= 1000 & 1110 = 1000，索引值即为8;
　　　　9的二进制表示：1001
　　　　9&（length-1）= 1001 & 1110 = 1000，索引值也为8;
　　　这样一来就产生了相同的索引值，也就是说两个hash值为8和9的key会定位到数组中的同一个位置上形成链表，这就产生了碰撞，降低了查询的效率
HashMap的初始大小和扩容都是以2的次方来进行的，换句话说length-1换成二进制永远是全部为1，比如容量为16，则length-1为1111，大家知道位运算的’&'规则是两个1才得1，遇0得0，也就是说length-1中的某一位为1，则对应位置的计算结果才取决于h中的对应位置（h中对应位取0,对应位结果为0，h对应位取1，对应位结果为1。这样就有两个结果），但是如果length-1中某一位为0，则不论h中对应位的数字为几，对应位结果都是0，这样就让两个h取到同一个结果，这就是hash冲突了，恰恰length-1又是全部为1的数，所以结果自然就将hash冲突最小化了。

h%length与h&（length-1）得到的结果其实是一个值，但是为什么hashmap中要用后者呢
　　　　1.length（2的整数次幂）的特殊性导致了length-1的特殊性（二进制全为1）
　　　　2.位运算快于十进制运算，hashmap扩容也是按位扩容，所以相比较就选择了后者

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。