首頁 >Java >java教程 >詳細解析Java集合框架

詳細解析Java集合框架

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB轉載: 2022-03-15 18:21:082281瀏覽

本篇文章為大家帶來了關於java的相關知識，其中主要介紹了集合框架的相關問題，Java集合框架提供了一套性能優良，使用方便的接口和類，他們位於java.util套件中，希望對大家有幫助。

詳細解析Java集合框架

推薦學習：《java學習教學》

一、簡介

1、集合架構介紹

Java集合框架提供了一套效能優良，使用方便的介面和類，他們位於java.util套件中。容器主要包括Collection 和Map 兩種，Collection 儲存物件的集合，而Map 則儲存鍵值對(兩個物件)的對應表

詳細解析Java集合框架

##2、相關容器介紹

2.1 Set相關

TreeSet 基於紅黑樹實現，支援有序性操作，例如根據一個範圍找出元素的操作。但是查找效率不如HashSet，HashSet 查找的時間複雜度為O(1)，TreeSet 則為O(logN)
HashSet 基於哈希表實現，支援快速查找，但不支援有序性操作。並且失去了元素的插入順序訊息，也就是說使用 Iterator 遍歷 HashSet 得到的結果是不確定的。
LinkedHashSet 具有 HashSet 的尋找效率，且內部使用雙向鍊錶維護元素的插入順序。

2.2 List相關

ArrayList 基於動態數組實現，支援隨機存取。
Vector 和 ArrayList 類似，但它是執行緒安全的。
LinkedList 基於雙向鍊錶實現，只能順序訪問，但是可以快速地在鍊錶中間插入和刪除元素。不僅如此，LinkedList 還可以用作堆疊、佇列和雙向佇列。

2.3 Queue相關

LinkedList 可以實作雙向佇列。
PriorityQueue 基於堆疊結構實現，可以用它來實現優先隊列。

2.4 Map相關

TreeMap 基於紅黑樹實作。
HashMap 基於哈希表實作。
HashTable 和 HashMap 類似，但它是執行緒安全的，這意味著同一時刻多個執行緒可以同時寫入 HashTable 並且不會導致資料不一致。它是遺留類，不應該去使用它。現在可以使用
ConcurrentHashMap 來支援線程安全，並且 ConcurrentHashMap 的效率會更高，因為 ConcurrentHashMap 引入了分段鎖定。
LinkedHashMap 使用雙向鍊錶來維護元素的順序，順序為插入順序或最近最少使用(LRU)順序

3、集合重點

List 介面儲存一組不唯一，有序的物件。
Set 介面儲存一組唯一，無序的物件
Map 介面儲存一組鍵值對象，提供key到value的映射
ArrayList實作了長度可變的數組，在記憶體中分配連續的空間。遍歷元素和隨機存取元素的效率比較高
LinkedList採用鍊錶儲存方式。插入、刪除元素時效率比較高
HashSet採用哈希演算法實現的Set
HashSet的底層是用HashMap實現的，因此查詢效率較高，由於採用hashCode演算法直接確定元素的記憶體位址，增刪效率高

二、ArrayList分析

1、ArrayList使用

##########################################################。 ###########說明######################boolean add(Object o)######在清單的最後順序新增元素，起始索引位置從0開始############void add(int index, Object o)######在指定的索引位置新增元素，###索引位置必須介於0與清單中元素個數之間###############int size()######傳回清單中的元素數量###### ######Object get(int index)######傳回指定索引位置處的元素。 ###取出的元素是Object型，使用前品要進行益制型別轉換################boolean contains(Object o)#######判斷清單中是否存在指定元素############boolean remove(Object o)######從清單中刪除元素############Object remove(int index） ######從清單中刪除指定位置元素，起始索引位量從0開始#############

2、ArrayList介紹

ArrayList是可以動態成長和縮減的索引序列，它是基於陣列實作的List類別
該類別封裝了一個動態再分配的Object[]數組，每個類別物件都有一個capacity[容量]屬性，表示它們所封裝的Object[]數組的長度，當在ArrayList中新增元素時，該屬性值會自動增加。如果想要ArrayList中加入大量元素，可使用ensureCapacity方法一次增加capacity，可以減少增加重新分配的次數提高效能
ArrayList的用法和Vector向類似，但是Vector是一個較老的集合，具有很多缺點，不建議使用

另外，ArrayList和Vector的區別是：ArrayList是線程不安全的，當多條線程訪問同一個ArrayList集合時，程式需要手動保證該集合的同步性，而Vector則是線程安全的。

3、原始碼分析

3.1 繼承結構與層次關係

public class ArrayList<e> extends AbstractList<e>
        implements List<e>, RandomAccess, Cloneable, java.io.Serializable</e></e></e>

詳細解析Java集合框架
這裡簡單解釋幾個介面

RandomAccess接口
這個是一個標記性接口，透過查看api文檔，它的作用就是用來快速隨機訪問，有關效率的問題，在實現了該接口的話，那麼使用普通的for迴圈來遍歷，效能更高，例如ArrayList。而沒有實作該介面的話，使用Iterator來迭代，這樣效能更高，例如linkedList。所以這個標記性只是為了讓我們知道我們用什麼樣的方式去獲取數據性能更好。
Cloneable介面
實作了該接口，就可以使用Object.Clone()方法了。
Serializable接口
實作此序列化接口，表示該類別可以被序列化。什麼是序列化？簡單的說，就是能夠從類別變成位元組流傳輸，然後還能從位元組流變成原來的類別。

這裡的繼承結構可透過IDEA中Navigate>Type Hierarchy查看

詳細解析Java集合框架

3.2 屬性

//版本号
private static final long serialVersionUID = 8683452581122892189L;
//缺省容量
private static final int DEFAULT_CAPACITY = 10;
//空对象数组
private static final Object[] EMPTY_ELEMENTDATA = {};
//缺省空对象数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//存储的数组元素
transient Object[] elementData; // non-private to simplify nested class access
//实际元素大小，默认为0
private int size;
//最大数组容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

3.3 建構方法

/**
 * 构造具有指定初始容量的空列表
 * 如果指定的初始容量为负，则为IllegalArgumentException
 */public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }}/**
 * 默认空数组的大小为10
 * ArrayList中储存数据的其实就是一个数组，这个数组就是elementData
 */public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;}/**
 * 按照集合迭代器返回元素的顺序构造包含指定集合的元素的列表
 */public ArrayList(Collection extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // 转换为数组
        //每个集合的toarray()的实现方法不一样，所以需要判断一下，如果不是Object[].class类型，那么久需要使用ArrayList中的方法去改造一下。
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // 否则就用空数组代替
        this.elementData = EMPTY_ELEMENTDATA;
    }}

3.4 自動擴容

每當在陣列中加入元素時，都要去檢查新增後元素的個數是否會超出目前陣列的長度，如果超出，數組將會進行擴容，以滿足添加資料的需求。陣列擴容透過一個公開的方法ensureCapacity(int minCapacity)來實現。 在實際加入大量元素前，我也可以使用ensureCapacity來手動增加ArrayList實例的容量，以減少遞增式再分配的數量。

陣列進行擴容時，會將**舊數組中的元素重新拷貝一份到新的數組中，每次數組容量的增長大約是其原始容量的1.5倍。 **這種操作的代價是很高的，因此在實際使用時，我們應該盡量避免數組容量的擴張。當我們可預知要保存的元素的多少時，要在建構ArrayList實例時，就指定其容量，以避免數組擴容的發生。或根據實際需求，透過呼叫ensureCapacity方法來手動增加ArrayList實例的容量。

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));}private static int calculateCapacity(Object[] elementData, int minCapacity) {
    //判断初始化的elementData是不是空的数组，也就是没有长度
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        //因为如果是空的话，minCapacity=size+1；其实就是等于1，空的数组没有长度就存放不了
        //所以就将minCapacity变成10，也就是默认大小，但是在这里，还没有真正的初始化这个elementData的大小
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    //确认实际的容量，上面只是将minCapacity=10，这个方法就是真正的判断elementData是否够用
    return minCapacity;}private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    //minCapacity如果大于了实际elementData的长度，那么就说明elementData数组的长度不够用
    /*第一种情况：由于elementData初始化时是空的数组，那么第一次add的时候，
    minCapacity=size+1；也就minCapacity=1，在上一个方法(确定内部容量ensureCapacityInternal)
    就会判断出是空的数组，就会给将minCapacity=10，到这一步为止，还没有改变elementData的大小。
    第二种情况：elementData不是空的数组了，那么在add的时候，minCapacity=size+1；也就是
    minCapacity代表着elementData中增加之后的实际数据个数，拿着它判断elementData的length
    是否够用，如果length不够用，那么肯定要扩大容量，不然增加的这个元素就会溢出。*/ 
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);}//ArrayList核心的方法，能扩展数组大小的真正秘密。private void grow(int minCapacity) {
    //将扩充前的elementData大小给oldCapacity
    int oldCapacity = elementData.length;
    //newCapacity就是1.5倍的oldCapacity
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    /*这句话就是适应于elementData就空数组的时候，length=0，那么oldCapacity=0，newCapacity=0，
    所以这个判断成立，在这里就是真正的初始化elementData的大小了，就是为10.前面的工作都是准备工作。
    */
    if (newCapacity - minCapacity  0)
        newCapacity = hugeCapacity(minCapacity);
    //新的容量大小已经确定好就copy数组，改变容量大小。
    elementData = Arrays.copyOf(elementData, newCapacity);}//用来赋最大值private static int hugeCapacity(int minCapacity) {
    if (minCapacity  MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
        MAX_ARRAY_SIZE;}

3.5 add()方法

/**
 * 添加一个特定的元素到list的末尾。
 * 先size+1判断数组容量是否够用，最后加入元素
 */public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;}/**
 * Inserts the specified element at the specified position in this
 * list. Shifts the element currently at that position (if any) and
 * any subsequent elements to the right (adds one to their indices).
 *
 * @param index index at which the specified element is to be inserted
 * @param element element to be inserted
 * @throws IndexOutOfBoundsException {@inheritDoc}
 */public void add(int index, E element) {
    //检查index也就是插入的位置是否合理。
    rangeCheckForAdd(index);
    //检查容量是否够用，不够就自动扩容
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    //这个方法就是用来在插入元素之后，要将index之后的元素都往后移一位
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;}

當呼叫add()方法時，實際函數呼叫：

add→ensureCapacityInternal→ensureExplicitCapacity(→grow→hugeCapacity )

例如剛開始初始化一個空數組後add一個值，會先進行自動擴容
詳細解析Java集合框架

3.6 trimToSize()

#將底層數組的容量調整為目前清單保存的實際元素的大小的功能

public void trimToSize() {
    modCount++;
    if (size <h3>3.7 remove()方法</h3><p><code>remove()</code>方法也有兩個版本，一個是<code>remove(int index)</code>刪除指定位置的元素，另一個是<code>remove(Object o)</code>刪除第一個滿足<code>o.equals(elementData[index])</code>的元素。刪除操作是<code>add()</code>操作的逆過程，需要將刪除點之後的元素向前移動一個位置。需要注意的是為了讓GC起作用，必須明確的為最後一個位置賦<code>null</code>值。 </p><pre class="brush:php;toolbar:false">public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; //清除该位置的引用，让GC起作用

        return oldValue;
    }

3.8 其他方法

這裡簡單介紹了核心方法，其他方法查看原始碼可以很快了解

3.9 Fail-Fast機制

#ArrayList採用了快速失敗的機制，透過記錄modCount參數來實現。在面對並發的修改時，迭代器很快就會完全失敗，並拋出ConcurrentModificationException異常，而不是冒著在將來某個不確定時間發生任意不確定行為的風險

4、總結

ArrayList可以存放null
ArrayList本質上就是一個elementData數組
ArrayList區別於數組的地方在於能夠自動擴展大小，其中關鍵的方法就是gorw()方法
ArrayList中removeAll(collection c)和clear()的差異就是removeAll可以刪除批次指定的元素，而clear是全刪除集合中的元素
ArrayList由於本質是數組，所以它在資料的查詢方面會很快，而在插入刪除這些方面，效能下降很多，有移動很多資料才能達到應有的效果
ArrayList實現了RandomAccess，所以在遍歷它的時候推薦使用for迴圈

#三、LinkedList分析

1、LinkedList使用

方法名稱說明#void addFirst(Object o)void addLast(Object o)







在清單的首部新增元素

在清單的未尾新增元素############ Object getFirst()######傳回清單中的第一個元素#############Object getLast()######傳回清單中的最後一個元素### #########Object removeFirst()######刪除並傳回清單中的第一個元素############Object removeLast()###### #刪除並傳回清單中的最後一個元素############

2、LinkedList介绍

LinkedList同时实现了List接口和Deque接口，也就是说它既可以看作一个顺序容器，又可以看作一个队列(Queue)，同时又可以看作一个栈(Stack)。这样看来，LinkedList简直就是个全能冠军。当你需要使用栈或者队列时，可以考虑使用LinkedList，一方面是因为Java官方已经声明不建议使用Stack类，更遗憾的是，Java里根本没有一个叫做Queue_的类(它是个接口名字)。关于栈或队列，现在的首选是ArrayDeque，它有着比LinkedList(当作栈或队列使用时)有着更好的性能。

LinkedList的实现方式决定了所有跟下标相关的操作都是线性时间，而在首段或者末尾删除元素只需要常数时间。为追求效率LinkedList没有实现同步(synchronized)，如果需要多个线程并发访问，可以先采用Collections.synchronizedList()方法对其进行包装

3、源码分析

3.1 继承结构与层次

public class LinkedList<e>
    extends AbstractSequentialList<e>
    implements List<e>, Deque<e>, Cloneable, java.io.Serializable</e></e></e></e>

詳細解析Java集合框架

这里可以发现LinkedList多了一层AbstractSequentialList的抽象类，这是为了减少实现顺序存取（例如LinkedList）这种类的工作。如果自己想实现顺序存取这种特性的类(就是链表形式)，那么就继承这个AbstractSequentialList抽象类，如果想像数组那样的随机存取的类，那么就去实现AbstracList抽象类。

List接口
列表add、set等一些对列表进行操作的方法
Deque接口
有队列的各种特性
Cloneable接口
能够复制，使用那个copy方法
Serializable接口
能够序列化。
没有RandomAccess
推荐使用iterator，在其中就有一个foreach，增强的for循环，其中原理也就是iterator，我们在使用的时候，使用foreach或者iterator

3.2 属性与构造方法

transient关键字修饰，这也意味着在序列化时该域是不会序列化的

//实际元素个数transient int size = 0;
//头结点transient Node<e> first;
//尾结点transient Node<e> last;</e></e>

public LinkedList() {}public LinkedList(Collection extends E> c) {
    this();
    //将集合c中的各个元素构建成LinkedList链表
    addAll(c);}

3.3 内部类Node

//根据前面介绍双向链表就知道这个代表什么了，linkedList的奥秘就在这里private static class Node<e> {
    // 数据域（当前节点的值）
    E item;
    //后继
    Node<e> next;
    //前驱
    Node<e> prev;
    // 构造函数，赋值前驱后继
    Node(Node<e> prev, E element, Node<e> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }}</e></e></e></e></e>

3.4 核心方法add()和addAll()

public boolean add(E e) {
    linkLast(e);
    return true;}void linkLast(E e) {
    //临时节点l(L的小写)保存last，也就是l指向了最后一个节点
    final Node<e> l = last;
    //将e封装为节点，并且e.prev指向了最后一个节点
    final Node<e> newNode = new Node(l, e, null);
    //newNode成为了最后一个节点，所以last指向了它
    last = newNode;
    if (l == null)
        //判断是不是一开始链表中就什么都没有，如果没有，则new Node就成为了第一个结点，first和last都指向它
        first = newNode;
    else
        //正常的在最后一个节点后追加，那么原先的最后一个节点的next就要指向现在真正的 最后一个节点，原先的最后一个节点就变成了倒数第二个节点
        l.next = newNode;
    //添加一个节点，size自增
    size++;
    modCount++;}</e></e>

addAll()有两个重载函数，addAll(Collection extends E>)型和addAll(int,Collection extends E>)型，我们平时习惯调用的addAll(Collection<?extends E>)型会转化为addAll(int,Collection extends<e>)</e>型

public boolean addAll(Collection extends E> c) {
    return addAll(size, c);}public boolean addAll(int index, Collection extends E> c) {
    //检查index这个是否为合理
    checkPositionIndex(index);
    //将集合c转换为Object数组
    Object[] a = c.toArray();
    //数组a的长度numNew，也就是由多少个元素
    int numNew = a.length;
    if (numNew == 0)
        //如果空的就什么也不做
        return false;

    Node<e> pred, succ;
    //构造方法中传过来的就是index==size
    //情况一：构造方法创建的一个空的链表，那么size=0，last、和first都为null。linkedList中是空的。
    //什么节点都没有。succ=null、pred=last=null
    //情况二：链表中有节点，size就不是为0，first和last都分别指向第一个节点，和最后一个节点，
    //在最后一个节点之后追加元素，就得记录一下最后一个节点是什么，所以把last保存到pred临时节点中。
    //情况三index！=size，说明不是前面两种情况，而是在链表中间插入元素，那么就得知道index上的节点是谁，
    //保存到succ临时节点中，然后将succ的前一个节点保存到pred中，这样保存了这两个节点，就能够准确的插入节点了
    if (index == size) {
        succ = null;
        pred = last;
    } else {
        succ = node(index);
        pred = succ.prev;
    }

    for (Object o : a) {
        @SuppressWarnings("unchecked") E e = (E) o;
        Node<e> newNode = new Node(pred, e, null);
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        pred = newNode;
    }

    if (succ == null) {
        /*如果succ==null，说明是情况一或者情况二，
        情况一、构造方法，也就是刚创建的一个空链表，pred已经是newNode了，
        last=newNode，所以linkedList的first、last都指向第一个节点。
        情况二、在最后节后之后追加节点，那么原先的last就应该指向现在的最后一个节点了，
        就是newNode。*/
        last = pred;
    } else {
        pred.next = succ;
        succ.prev = pred;
    }

    size += numNew;
    modCount++;
    return true;}//根据引下标找到该结点并返回Node<e> node(int index) {
    //判断插入的位置在链表前半段或者是后半段
    if (index > 1)) {
        Node<e> x = first;
        //从头结点开始正向遍历
        for (int i = 0; i  x = last;
        //从尾结点开始反向遍历
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }}</e></e></e></e>

3.5 remove()

/*如果我们要移除的值在链表中存在多个一样的值，那么我们
会移除index最小的那个，也就是最先找到的那个值，如果不存在这个值，那么什么也不做
*/public boolean remove(Object o) {
    if (o == null) {
        for (Node<e> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<e> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;}不能传一个null值E unlink(Node<e> x) {
    // assert x != null;
    final E element = x.item;
    final Node<e> next = x.next;
    final Node<e> prev = x.prev;

    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }

    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }
    //x的前后指向都为null了，也把item为null，让gc回收它
    x.item = null;
    size--;
    modCount++;
    return element;}</e></e></e></e></e>

3.6 其他方法

**get(index)、indexOf(Object o)**等查看源码即可

3.7 LinkedList的迭代器

在LinkedList中除了有一个Node的内部类外，应该还能看到另外两个内部类，那就是ListItr，还有一个是DescendingIterator内部类

詳細解析Java集合框架

/*这个类，还是调用的ListItr，作用是封装一下Itr中几个方法，让使用者以正常的思维去写代码，
例如，在从后往前遍历的时候，也是跟从前往后遍历一样，使用next等操作，而不用使用特殊的previous。
*/private class DescendingIterator implements Iterator<e> {
    private final ListItr itr = new ListItr(size());
    public boolean hasNext() {
        return itr.hasPrevious();
    }
    public E next() {
        return itr.previous();
    }
    public void remove() {
        itr.remove();
    }}</e>

4、总结

linkedList本质上是一个双向链表，通过一个Node内部类实现的这种链表结构。linkedList能存储null值
跟ArrayList相比较，就真正的知道了，LinkedList在删除和增加等操作上性能好，而ArrayList在查询的性能上好，从源码中看，它不存在容量不足的情况
linkedList不光能够向前迭代，还能像后迭代，并且在迭代的过程中，可以修改值、添加值、还能移除值
linkedList不光能当链表，还能当队列使用，这个就是因为实现了Deque接口

四、List总结

1、ArrayList和LinkedList区别

ArrayList底层是用数组实现的顺序表，是随机存取类型，可自动扩增，并且在初始化时，数组的长度是0，只有在增加元素时，长度才会增加。默认是10，不能无限扩增，有上限，在查询操作的时候性能更好
LinkedList底层是用链表来实现的，是一个双向链表，注意这里不是双向循环链表,顺序存取类型。在源码中，似乎没有元素个数的限制。应该能无限增加下去，直到内存满了在进行删除，增加操作时性能更好。

两个都是线程不安全的，在iterator时，会发生fail-fast：快速失效。

2、ArrayList和Vector區別

ArrayList執行緒不安全，在用iterator，會發生fail-fast
Vector執行緒安全，因為在方法前面加了Synchronized關鍵字，也會發生fail-fast

3、fail-fast和fail-safe區別與情況說明

在java.util下的集合都是發生fail -fast，而java.util.concurrent下的發生的都是fail-safe

fail-fast## 快速失敗，例如在arrayList中使用迭代器遍歷時，有另外的執行緒對arrayList的儲存數組進行了改變，例如add、delete等使之發生了結構上的改變，所以Iterator就會快速報一個
java.util.ConcurrentModiﬁcationException異常（並發修改異常），這就是快速失敗
fail-safe 安全失敗，在
java.util.concurrent下的類，都是線程安全的類，他們在迭代的過程中，如果有線程進行結構的改變，不會報異常，而是正常遍歷，這就是安全失敗
為什麼在java.util. concurrent套件下對集合有結構的改變卻不會回報異常？在concurrent下的集合類別增加元素的時候使用
Arrays.copyOf()來拷貝副本，在副本上增加元素，如果有其他執行緒在此改變了集合的結構，那也是在副本上的改變，而不是影響到原集合，迭代器還是照常遍歷，遍歷完之後，改變原引用指向副本，所以總的一句話就是如果在此包下的類別進行增加刪除，就會出現一個副本。所以能防止fail-fast，這個機制不會出錯，所以我們叫這種現象為fail-safe
vector也是執行緒安全的，為什麼是fail-fast呢？出現fail-safe是因為他們在實作增刪的底層機制不一樣，就像上面說的，會有一個副本，而像arrayList、linekdList、verctor等他們底層就是對著真正的引用進行操作，所以才會發生異常

4、為什麼現在都不提倡使用Vector

如果多個Thread並發執行一個已經加鎖的方法，但是在該方法中，又有Vector的存在，Vector
本身實作中已經加鎖了，那麼相當於鎖上又加鎖，會造成額外的開銷

總結：Vector在你不需要進行線程安全的時候，也會給你加鎖，也就導致了額外開銷，所以在jdk1.5之後就被棄用了，現在如果要用到線程安全的集合，都是從

java.util.concurrent套件下去拿對應的類別。

五、HashMap分析

1、HashMap介紹

1.1 Java8以前的HashMap

透過key、value封裝成entry對象，然後透過key的值來計算該entry的hash值，透過entry的hash 值和陣列的長度length來計算entry放在陣列中的哪個位置上面，每次存放都是將entry放在第一個位置。

HashMap實作了Map接口，也就是允許放入

key為null的元素，也允許插入value為null的元素；除該類別未實現同步外，其餘跟Hashtable大致相同；跟TreeMap不同，該容器不保證元素順序，根據需要該容器可能會對元素重新哈希，元素的順序也會被重新打散，因此不同時間迭代同一個HashMap的順序可能會不同。根據對衝突的處理方式不同，雜湊表有兩種實作方式，一種開放位址方式(Open addressing)，另一種是衝突鍊錶方式(Separate chaining with linked lists)。 Java7 HashMap採用的是衝突鍊錶方式。

詳細解析Java集合框架

1.2 Java8后的HashMap

Java8 对 HashMap 进行了一些修改，最大的不同就是利用了红黑树，所以其由 数组+链表+红黑树 组成。根据 Java7 HashMap 的介绍，我们知道，查找的时候，根据 hash 值我们能够快速定位到数组的具体下标，但是之后的话，需要顺着链表一个个比较下去才能找到我们需要的，时间复杂度取决于链表的长度为 O(n)。为了降低这部分的开销，在 Java8 中，当链表中的元素达到了 8 个时，会将链表转换为红黑树，在这些位置进行查找的时候可以降低时间复杂度为 O(logN)。
詳細解析Java集合框架

Java7 中使用 Entry 来代表每个 HashMap 中的数据节点，Java8 中使用 Node，基本没有区别，都是 key，value，hash 和 next 这四个属性，不过，Node 只能用于链表的情况，红黑树的情况需要使用 TreeNode

2、Java8 HashMap源码分析

2.1 继承结构与层次

public class HashMap<k> extends AbstractMap<k>
    implements Map<k>, Cloneable, Serializable</k></k></k>

詳細解析Java集合框架

2.2 属性

//序列号private static final long serialVersionUID = 362498820763181265L;
//默认的初始容量static final int DEFAULT_INITIAL_CAPACITY = 1 [] table;
//存放具体元素的集transient Set<map.entry>> entrySet;
//存放元素的个数，注意这个不等于数组的长度transient int size;
//每次扩容和更改map结构的计数器transient int modCount;
//临界值，当实际大小(容量*填充因子)超过临界值时，会进行扩容int threshold;
//填充因子,计算HashMap的实时装载因子的方法为：size/capacityfinal float loadFactor;</map.entry>

2.3 构造方法

public HashMap(int initialCapacity, float loadFactor) {
    // 初始容量不能小于0，否则报错
    if (initialCapacity  MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    //填充因子不能小于或等于0，不能为非数字
    if (loadFactor >> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n = MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;}/**
 * 自定义初始容量，加载因子为默认
 */public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);}/**
 * 使用默认的加载因子等字段
 */public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted}public HashMap(Map extends K, ? extends V> m) {
    //初始化填充因子
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    //将m中的所有元素添加至HashMap中
    putMapEntries(m, false);}//将m的所有元素存入该实例final void putMapEntries(Map extends K, ? extends V> m, boolean evict) {
    int s = m.size();
    if (s > 0) {
        //判断table是否已经初始化
        if (table == null) { // pre-size
            //未初始化，s为m的实际元素个数
            float ft = ((float)s / loadFactor) + 1.0F;
            int t = ((ft  threshold)
                threshold = tableSizeFor(t);
        }
        else if (s > threshold)
            resize();
        //将m中的所有元素添加至HashMap中
        for (Map.Entry extends K, ? extends V> e : m.entrySet()) {
            K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }}

2.4 核心方法

put()方法

先计算key的hash值，然后根据hash值搜索在table数组中的索引位置，如果table数组在该位置处有元素，则查找是否存在相同的key，若存在则覆盖原来key的value，否则将该元素保存在链表尾部，注意JDK1.7中采用的是头插法，即每次都将冲突的键值对放置在链表头，这样最初的那个键值对最终就会成为链尾，而JDK1.8中使用的是尾插法。此外，若table在该处没有元素，则直接保存。

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);}final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<k>[] tab; Node<k> p; int n, i;
    //第一次put元素时，table数组为空，先调用resize生成一个指定容量的数组
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //hash值和n-1的与运算结果为桶的位置，如果该位置空就直接放置一个Node
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    //如果计算出的bucket不空，即发生哈希冲突，就要进一步判断
    else {
        Node<k> e; K k;
        //判断当前Node的key与要put的key是否相等
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        //判断当前Node是否是红黑树的节点
        else if (p instanceof TreeNode)
            e = ((TreeNode<k>)p).putTreeVal(this, tab, hash, key, value);
        //以上都不是，说明要new一个Node，加入到链表中
        else {
            for (int binCount = 0; ; ++binCount) {
              //在链表尾部插入新节点，注意jdk1.8是在链表尾部插入新节点
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 如果当前链表中的元素大于树化的阈值，进行链表转树的操作
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                //在链表中继续判断是否已经存在完全相同的key
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        //走到这里，说明本次put是更新一个已存在的键值对的value
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            //在hashMap中，afterNodeAccess方法体为空，交给子类去实现
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    //如果当前size超过临界值，就扩容。注意是先插入节点再扩容
    if (++size > threshold)
        resize();
    //在hashMap中，afterNodeInsertion方法体为空，交给子类去实现
    afterNodeInsertion(evict);
    return null;}</k></k></k></k>

resize() 数组扩容

用于初始化数组或数组扩容，每次扩容后，容量为原来的 2 倍，并进行数据迁移

final Node<k>[] resize() {
    Node<k>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) { // 对应数组扩容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 将数组大小扩大一倍
        else if ((newCap = oldCap = DEFAULT_INITIAL_CAPACITY)
            // 将阈值扩大一倍
            newThr = oldThr  0) // 对应使用 new HashMap(int initialCapacity) 初始化后，第一次 put 的时候
        newCap = oldThr;
    else {// 对应使用 new HashMap() 初始化后，第一次 put 的时候
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }

    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap [] newTab = (Node<k>[])new Node[newCap];
    table = newTab; // 如果是初始化数组，到这里就结束了，返回 newTab 即可

    if (oldTab != null) {
        // 开始遍历原数组，进行数据迁移。
        for (int j = 0; j  e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                // 如果该数组位置上只有单个元素，那就简单了，简单迁移这个元素就可以了
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                // 如果是红黑树，具体我们就不展开了
                else if (e instanceof TreeNode)
                    ((TreeNode<k>)e).split(this, newTab, j, oldCap);
                else { 
                    // 这块是处理链表的情况，
                    // 需要将此链表拆成两个链表，放到新的数组中，并且保留原来的先后顺序
                    // loHead、loTail 对应一条链表，hiHead、hiTail 对应另一条链表，代码还是比较简单的
                    Node<k> loHead = null, loTail = null;
                    Node<k> hiHead = null, hiTail = null;
                    Node<k> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        // 第一条链表
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        // 第二条链表的新的位置是 j + oldCap，这个很好理解
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;}</k></k></k></k></k></k></k>

get()过程

public V get(Object key) {
    Node<k> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;}final Node<k> getNode(int hash, Object key) {
    Node<k>[] tab; Node<k> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 判断第一个节点是不是就是需要的
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            // 判断是否是红黑树
            if (first instanceof TreeNode)
                return ((TreeNode<k>)first).getTreeNode(hash, key);

            // 链表遍历
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;}</k></k></k></k></k>

2.5 其他方法

HashSet是对HashMap的简单包装，其他还有迭代器等

3、总结

关于数组扩容，从putVal源代码中我们可以知道，当插入一个元素的时候size就加1，若size大于threshold的时候，就会进行扩容。假设我们的capacity大小为32，loadFator为0.75，则threshold为24 = 32 * 0.75，此时，插入了25个元素，并且插入的这25个元素都在同一个桶中，桶中的数据结构为红黑树，则还有31个桶是空的，也会进行扩容处理，其实此时，还有31个桶是空的，好像似乎不需要进行扩容处理，但是是需要扩容处理的，因为此时我们的capacity大小可能不适当。我们前面知道，扩容处理会遍历所有的元素，时间复杂度很高；前面我们还知道，经过一次扩容处理后，元素会更加均匀的分布在各个桶中，会提升访问效率。所以说尽量避免进行扩容处理，也就意味着，遍历元素所带来的坏处大于元素在桶中均匀分布所带来的好处。

HashMap在JDK1.8以前是一个链表散列这样一个数据结构，而在JDK1.8以后是一个数组加链表加红黑树的数据结构
通过源码的学习，HashMap是一个能快速通过key获取到value值得一个集合，原因是内部使用的是hash查找值得方法

另外LinkedHashMap是HashMap的直接子类，二者唯一的区别是LinkedHashMap在HashMap的基础上，采用双向链表(doubly-linked list)的形式将所有**entry**连接起来，这样是为保证元素的迭代顺序跟插入顺序相同

六、Collections工具类

1、概述

此类完全由在 collection 上进行操作或返回 collection 的静态方法组成。它包含在 collection 上操作的多态算法，即“包装器”，包装器返回由指定 collection 支持的新 collection，以及少数其他内容。如果为此类的方法所提供的 collection 或类对象为 null，则这些方法都将抛出NullPointerException

2、排序常用方法

//反转列表中元素的顺序
static void reverse(List> list)
//对List集合元素进行随机排序
static void shuffle(List> list)
//根据元素的自然顺序 对指定列表按升序进行排序
static void sort(List<t> list)
//根据指定比较器产生的顺序对指定列表进行排序
static <t> void sort(List<t> list, Comparator super T> c)
//在指定List的指定位置i,j处交换元素
static void swap(List> list, int i, int j)
//当distance为正数时，将List集合的后distance个元素“整体”移到前面；当distance为负数时，将list集合的前distance个元素“整体”移到后边。该方法不会改变集合的长度
static void rotate(List> list, int distance)</t></t></t>

3、查找、替换操作

//使用二分搜索法搜索指定列表，以获得指定对象在List集合中的索引
//注意：此前必须保证List集合中的元素已经处于有序状态
static <t> int binarySearch(List extends Comparable super T>>list, T key)
//根据元素的自然顺序，返回给定collection 的最大元素
static Object max(Collection coll)
//根据指定比较器产生的顺序，返回给定 collection 的最大元素
static Object max(Collection coll,Comparator comp):
//根据元素的自然顺序，返回给定collection 的最小元素
static Object min(Collection coll):
//根据指定比较器产生的顺序，返回给定 collection 的最小元素
static Object min(Collection coll,Comparator comp):
//使用指定元素替换指定列表中的所有元素
static <t> void fill(List super T> list,T obj)
//返回指定co1lection中等于指定对象的出现次数
static int frequency(collection>c,object o)
//返回指定源列表中第一次出现指定目标列表的起始位置；如果没有出现这样的列表，则返回-1
static int indexofsubList(List>source, List>target)
//返回指定源列表中最后一次出现指定目标列表的起始位置；如果没有出现这样的列表，则返回-1
static int lastIndexofsubList(List>source,List>target)
//使用一个新值替换List对象的所有旧值o1dval
static <t> boolean replaceA1l(list<t> list,T oldval,T newval)</t></t></t></t>

4、同步控制

Collectons提供了多个synchronizedXxx()方法，该方法可以将指定集合包装成线程同步的集合，从而解决多线程并发访问集合时的线程安全问题。正如前面介绍的HashSet，TreeSet，arrayList，LinkedList，HashMap，TreeMap都是线程不安全的。Collections提供了多个静态方法可以把他们包装成线程同步的集合。

//返回指定 Collection 支持的同步（线程安全的）collection
static <T> Collection<T> synchronizedCollection(Collection<T> c)
//返回指定列表支持的同步（线程安全的）列表
static <T> List<T> synchronizedList(List<T> list)
//返回由指定映射支持的同步（线程安全的）映射
static <K,V> Map<K,V> synchronizedMap(Map<K,V> m)
//返回指定 set 支持的同步（线程安全的）set
static <T> Set<T> synchronizedSet(Set<T> s)

5、Collection设置不可变集合

//返回一个空的、不可变的集合对象，此处的集合既可以是List，也可以是Set，还可以是Map。
emptyXxx()
//返回一个只包含指定对象（只有一个或一个元素）的不可变的集合对象，此处的集合可以是：List，Set，Map。
singletonXxx():
//返回指定集合对象的不可变视图，此处的集合可以是：List，Set，Map
unmodifiableXxx()

推荐学习：《java教程》

以上是詳細解析Java集合框架的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文轉載於：csdn.net。如有侵權，請聯絡admin@php.cn刪除

上一篇：深入了解java之CAS詳解下一篇：深入了解java之CAS詳解

看更多