Timsort 是一個混合、穩定的排序演算法,簡單來說就是歸併排序和二分插入排序演算法的混合體,號稱世界上最好的排序演算法。 Timsort一直是 Python 的標準排序演算法。 Java SE 7 後面加入了Timsort API ,我們從Arrays.sort
可以看出它已經是非原始型別數組的預設排序演算法了。所以不管是進階程式設計學習還是面試,理解 Timsort 是比較重要。
// List sort() default void sort(Comparator<? super E> c) { Object[] a = this.toArray(); //数组排序 Arrays.sort(a, (Comparator) c); ... } // Arrays.sort public static <T> void sort(T[] a, Comparator<? super T> c) { if (c == null) { sort(a); } else { // 废弃版本 if (LegacyMergeSort.userRequested) legacyMergeSort(a, c); else TimSort.sort(a, 0, a.length, c, null, 0, 0); } } public static void sort(Object[] a) { if (LegacyMergeSort.userRequested) legacyMergeSort(a); else ComparableTimSort.sort(a, 0, a.length, null, 0, 0); }
理解 Timsort 需要先回顧下面的知識。
指數搜索,也被稱為加倍搜索,是一種用於在大型數組中搜索元素而創建的演算法。它是一個兩步驟的過程。首先,演算法試圖找到目標元素存在的範圍 (L,R)
,然後在這個範圍內使用二元搜尋來尋找目標的準確位置。時間複雜度為O(lgn)。此搜尋演算法在大量有序數組中比較有效。
插入排序演算法很簡單,大體過程是從第二個元素開始,依序向前移動交換元素直到找到合適的位置。
插入排序最適時間複雜度也要O(n) ,我們可以使用二分查找來減少插入時元素的比較次數,將時間複雜度降為logn 。但是注意,二分查找插入排序仍然需要移動相同數量的元素,但是複製數組的時間消耗低於逐一互換操作。
特點:二分插入排序主要優點是在小資料集場景下排序效率很高。
public static int[] sort(int[] arr) throws Exception { // 开始遍历第一个元素后的所有元素 for (int i = 1; i < arr.length; i++) { // 需要插入的元素 int tmp = arr[i]; // 从已排序最后一个元素开始,如果当前元素比插入元素大,就往后移动 int j = i; while (j > 0 && tmp < arr[j - 1]) { arr[j] = arr[j - 1]; j--; } // 将元素插入 if (j != i) { arr[j] = tmp; } } return arr; } public static int[] binarySort(int[] arr) throws Exception { for (int i = 1; i < arr.length; i++) { // 需要插入的元素 int tmp = arr[i]; // 通过二分查找直接找到插入位置 int j = Math.abs(Arrays.binarySearch(arr, 0, i, tmp) + 1); // 找到插入位置后,通过数组复制向后移动,腾出元素位置 System.arraycopy(arr, j, arr, j + 1, i - j); // 将元素插入 arr[j] = tmp; } return arr; }
歸併排序是利用分治策略的演算法,包含兩個主要的操作:分割與合併 。大體過程是,透過遞歸將數組不斷分成兩半,一直到無法再分割(也就是數組為空或只剩下一個元素),然後進行合併排序。簡單來說合併操作就是不斷取兩個較小的排序數組然後將它們組合成一個更大的數組。
特點:歸併排序主要為大資料集場景設計的排序演算法。
public static void mergeSortRecursive(int[] arr, int[] result, int start, int end) { // 跳出递归 if (start >= end) { return; } // 待分割的数组长度 int len = end - start; int mid = (len >> 1) + start; int left = start; // 左子数组开始索引 int right = mid + 1; // 右子数组开始索引 // 递归切割左子数组,直到只有一个元素 mergeSortRecursive(arr, result, left, mid); // 递归切割右子数组,直到只有一个元素 mergeSortRecursive(arr, result, right, end); int k = start; while (left <= mid && right <= end) { result[k++] = arr[left] < arr[right] ? arr[left++] : arr[right++]; } while (left <= mid) { result[k++] = arr[left++]; } while (right <= end) { result[k++] = arr[right++]; } for (k = start; k <= end; k++) { arr[k] = result[k]; } } public static int[] merge_sort(int[] arr) { int len = arr.length; int[] result = new int[len]; mergeSortRecursive(arr, result, 0, len - 1); return arr; }
演算法大體過程,如果陣列長度小於指定閥值(MIN_MERGE)直接使用二分插入演算法完成排序,否則執行下面步驟:
先從陣列左邊開始,執行升序運行得到一個子序列。
將這個子序列放入運行堆疊裡,等待執行合併。
檢查運行堆疊裡的子序列,如果滿足合併條件則執行合併。
重複第一個步驟,執行下一個升序運行。
升序運行就是從數組尋找一段連續遞增(升序)或遞減(降序)子序列的過程,如果子序列為降序則將它反轉為升序,也可以將此過程簡稱為 run
。例如數組[2,3,6,4,9,30],可以查找到三個子序列,[2,3,6]、[4,9]、[30],或說3個 run
。
MIN_MERGE
#這是一個常數值,可以簡單理解為執行歸併的最小閥值,如果整個陣列長度小於它,就沒必要執行那麼複雜的排序,直接二分插入就行了。在 Tim Peter 的 C 實作中為 64,但實際經驗中設定為 32 效果較好,所以 java 裡面此值為 32。
降序反轉時為確保穩定性,相同元素不會被顛倒。
minrun
在合併序列的時候,如果 run
數量等於或略小於2 的冪次方的時候,合併效率最高;如果略大於2 的冪次方,效率就會顯著降低。所以為了提高合併效率,需要盡量控制每個 run
的長度,透過定義一個 minrun 來表示每個 run
的最小長度,如果長度太短,就用二分插入排序把 run
後面的元素插入到前面的 run
裡面。
一般在執行排序演算法之前,會先計算出這個minrun(它是根據資料的特性來進行自我調整),minrun 會從32到64選擇一個數字,因此資料的大小除以minrun 等於或略小於2 的冪次方。例如長度是 65 ,那麼 minrun 的值就是 33;如果長度是 165,minrun 就是 42。
看下 Java 里面的实现,如果数据长度(n) 数据长度恰好是 2 的幂次方,则返回MIN_MERGE/2
也就是16,否则返回一个MIN_MERGE/2
private static int minRunLength(int n) { assert n >= 0; int r = 0; // 如果低位任何一位是1,就会变成1 while (n >= MIN_MERGE) { r |= (n & 1); n >>= 1; } return n + r; }
MIN_GALLOP
MIN_GALLOP 是为了优化合并的过程设定的一个阈值,控制进入 GALLOP
模式中, GALLOP
模式放在后面讲。
下面是 Timsort 执行流程图
当栈里面的 run
满足合并条件时,它就将栈里面相邻的两个run 进行合并。
Timsort 为了执行平衡合并(让合并的 run 大小尽可能相同),制定了一个合并规则,对于在栈顶的三个run,分别用X、Y 和 Z 表示他们的长度,其中 X 在栈顶,它们必须始终维持一下的两个规则:
一旦有其中的一个条件不被满足,则将 Y 与 X 或 Z 中的较小者合并生成新的 run
,并再次检查栈顶是否仍然满足条件。如果不满足则会继续进行合并,直至栈顶的三个元素都满足这两个条件,如果只剩两个run
,则满足 Y > X 即可。
如下下图例子
当 Z
检测 Y
我们看下 Java 里面的合并实现
private void mergeCollapse() { // 当存在两个以上run执行合并检查 while (stackSize > 1) { // 表示 Y int n = stackSize - 2; // Z <= Y + X if (n > 0 && runLen[n-1] <= runLen[n] + runLen[n+1]) { // 如果 Z < X 合并Z+Y ,否则合并X+Y if (runLen[n - 1] < runLen[n + 1]) n--; // 合并相邻的两个run,也就是runLen[n] 和 runLen[n+1] mergeAt(n); } else if (runLen[n] <= runLen[n + 1]) { // Y <= X 合并 Y+X mergeAt(n); } else { // 满足两个条件,跳出循环 break; } } }
原始归并排序空间复杂度是 O(n)也就是数据大小。为了实现中间项,Timsort 进行了一次归并排序,时间开销和空间开销都比 O(n)小。
优化是为了尽可能减少数据移动,占用更少的临时内存,先找出需要移动的元素,然后将较小序列复制到临时内存,在按最终顺序排序并填充到组合序列中。
比如我们需要合并 X [1, 2, 3, 6, 10] 和 Y [4, 5, 7, 9, 12, 14, 17],X 中最大元素是10,我们可以通过二分查找确定,它需要插入到 Y 的第 5个位置才能保证顺序,而 Y 中最小元素是4,它需要插入到 X 中的第4个位置才能保证顺序,那么就知道了[1, 2, 3] 和 [12, 14, 17] 不需要移动,我们只需要移动 [6, 10] 和 [4, 5, 7, 9],然后只需要分配一个大小为 2 临时存储就可以了。
在归并排序算法中合并两个数组需要一一比较每个元素,为了优化合并的过程,设定了一个阈值 MIN_GALLOP,当B中元素向A合并时,如果A中连续 MIN_GALLOP 个元素比B中某一个元素要小,那么就进入GALLOP模式。
根据基准测试,比如当A中连续7个以上元素比B中某一元素小时切入该模式效果才好,所以初始值为7。
当进入GALLOP模式后,搜索算法变为指数搜索,分为两个步骤,比如想确定 A 中元素x在 B 中确定的位置
首先在 B 中找到合适的索引区间(2k−1,2k+1−1) 使得 x 元素在这个范围内;
然后在第一步找到的范围内通过二分搜索来找到对应的位置。
只有当一次运行的初始元素不是另一次运行的前七个元素之一时,驰骋才是有益的。这意味着初始阈值为 7。
以上是Java實作Timsort排序演算法的步驟與實現的詳細內容。更多資訊請關注PHP中文網其他相關文章!