Python實作二元堆的方法-Python教學-PHP中文網

首頁

後端開發

Python教學

Python實作二元堆的方法

高洛峰

Mar 13, 2017 pm 06:10 PM

python二元堆

二元堆是一種特殊的堆，二元堆是完全二元樹（二元樹）或近似完全二元樹（二元樹）。二元堆有兩種：最大堆和最小堆。最大堆：父結點的鍵值總是大於或等於任何一個子節點的鍵值；最小堆：父結點的鍵值總是小於或等於任何一個子節點的鍵值。

優先佇列的二元堆實作

在前面的章節裡我們學習了「先進先出」（FIFO）的資料結構：隊列（Queue）。隊列有一種變體叫做「優先隊列」（Priority Queue）。優先隊列的出隊（Dequeue）操作和隊列一樣，都是從隊首出隊。但在優先隊列的內部，元素的次序是由「優先」來決定：高優先級的元素排在隊首，而低優先級的元素則排在後面。這樣，優先隊列的入隊（Enqueue）操作就比較複雜，需要將元素依照優先權盡量排到佇列前面。我們將會發現，對於下一節要學的圖演算法中的優先隊列是很有用的資料結構。

我們很自然地會想到用排序演算法和佇列的方法來實作優先隊列。但是，在列表裡插入一個元素的時間複雜度是O(n)，對列表進行排序的時間複雜度是O(nlogn)。我們可以用別的方法來降低時間複雜度。一個實現優先隊列的經典方法就是採用二元堆（Binary Heap）。二元堆能將優先隊列的入隊和出隊複雜度都保持在O(logn)。

二元堆的有趣之處在於，其邏輯結構上像二元樹，卻是用非嵌套的列表來實現。二元堆有兩種：鍵值總是最小的排在隊首稱為“最小堆（min heap）”，反之，鍵值總是最大的排在隊首稱為“最大堆（max heap）」。在這一節裡我們使用最小堆。

二元堆的操作

二元堆的基本運算定義如下：

BinaryHeap() ：建立一個空的二元堆物件
insert(k)：將新元素加入堆中
#findMin()：傳回堆中的最小項，最小項仍保留在堆中
##delMin()：傳回堆中的最小項，同時從堆中刪除
isEmpty()：傳回堆是否為空
size()：傳回堆中節點的個數
#buildHeap(list)：從一個包含節點的清單建立新堆

下面所示程式碼是二元堆的範例。可以看到無論我們以哪種順序把元素加到堆裡，每次都是移除最小的元素。我們接下來要來實現這個過程。

from pythonds.trees.binheap import BinHeap

bh = BinHeap()
bh.insert(5)
bh.insert(7)
bh.insert(3)
bh.insert(11)

print(bh.delMin())

print(bh.delMin())

print(bh.delMin())

print(bh.delMin())

為了更好地實作堆，我們採用二元樹。我們必須始終保持二元樹的“平衡”，就要使操作始終保持在對數數量級上。平衡的二元樹根節點的左右子樹的子節點個數相同。在堆的實作中，我們採用「完全二元樹」的結構來近似地實現「平衡」。完全二元樹，指每個內部節點樹都達到最大值，除了最後一層可以只缺少右邊的若干節點。圖 1 所示為完全二元樹。

Python實作二元堆的方法

圖 1：完全二元樹

有趣的是我們用單一清單就能實現完全樹。我們不需要使用節點，引用或巢狀列表。因為對於完全二元樹，如果節點在列表中的下標為 p，那麼其左子節點下標為 2p，右節點為 2p+1。當我們要找任何節點的父節點時，可以直接使用 python 的整除。如果節點在列表中下標為

n，那麼父節點下標為n//2.圖 2 所示是一個完全二元樹和樹的列表表示法。注意父節點與子節點之間 2p 與 2p+1 的關係。完全樹的列表表示法結合了完全二元樹的特性，使我們能夠使用簡單的數學方法有效地遍歷一棵完全樹。這也使我們能高效實現二元堆。

堆次序的性質

我們在堆裡儲存元素的方法依賴堆的次序。所謂堆次序，是指堆中任何一個節點 x，其父節點 p 的鍵值均小於或等於 x 的鍵值。圖 2 所示是具備堆次序性質的完全二元樹。

Python實作二元堆的方法

圖 2：完全樹與它的列表表示法

#二元堆疊運算的實作#

接下来我们来构造二叉堆。因为可以采用一个列表保存堆的数据，构造函数只需要初始化一个列表和一个currentSize来表示堆当前的大小。Listing 1 所示的是构造二叉堆的 python 代码。注意到二叉堆的heaplist并没有用到，但为了后面代码可以方便地使用整除，我们仍然保留它。

Listing 1

class BinHeap:
  def init(self):
    self.heapList = [0]
    self.currentSize = 0

我们接下来要实现的是insert方法。首先，为了满足“完全二叉树”的性质，新键值应该添加到列表的末尾。然而新键值简单地添加在列表末尾，显然无法满足堆次序。但我们可以通过比较父节点和新加入的元素的方法来重新满足堆次序。如果新加入的元素比父节点要小，可以与父节点互换位置。图 3 所示的是一系列交换操作来使新加入元素“上浮”到正确的位置。

Python實作二元堆的方法

图 3：新节点“上浮”到其正确位置

当我们让一个元素“上浮”时，我们要保证新节点与父节点以及其他兄弟节点之间的堆次序。当然，如果新节点非常小，我们仍然需要将它交换到其他层。事实上，我们需要不断交换，直到到达树的顶端。Listing 2 所示的是“上浮”方法，它把一个新节点“上浮”到其正确位置来满足堆次序。这里很好地体现了我们之前在headlist中没有用到的元素 0 的重要性。这样只需要做简单的整除，将当前节点的下标除以 2，我们就能计算出任何节点的父节点。

在Listing 3 中，我们已经可以写出insert方法的代码。insert里面很大一部分工作是由percUp函数完成的。当树添加新节点时，调用percUp就可以将新节点放到正确的位置上。

Listing 2

def percUp(self,i):
  while i // 2 > 0:
   if self.heapList[i] < self.heapList[i // 2]:
     tmp = self.heapList[i // 2]
     self.heapList[i // 2] = self.heapList[i]
     self.heapList[i] = tmp
   i = i // 2

Listing 3

def insert(self,k):
  self.heapList.append(k)
  self.currentSize = self.currentSize + 1
  self.percUp(self.currentSize)

我们已经写好了insert方法，那再来看看delMin方法。堆次序要求根节点是树中最小的元素，因此很容易找到最小项。比较困难的是移走根节点的元素后如何保持堆结构和堆次序，我们可以分两步走。首先，用最后一个节点来代替根节点。移走最后一个节点保持了堆结构的性质。这么简单的替换，还是会破坏堆次序。那么第二步，将新节点“下沉”来恢复堆次序。图 4 所示的是一系列交换操作来使新节点“下沉”到正确的位置。

Python實作二元堆的方法

图 4：替换后的根节点下沉

为了保持堆次序，我们需将新的根节点沿着一条路径“下沉”，直到比两个子节点都小。在选择下沉路径时，如果新根节点比子节点大，那么选择较小的子节点与之交换。Listing 4 所示的是新节点下沉所需的percDown和minChild方法的代码。

Listing 4

def percDown(self,i):
  while (i * 2) <= self.currentSize:
    mc = self.minChild(i)
    if self.heapList[i] > self.heapList[mc]:
      tmp = self.heapList[i]
      self.heapList[i] = self.heapList[mc]
      self.heapList[mc] = tmp
    i = mc

def minChild(self,i):
  if i * 2 + 1 > self.currentSize:
    return i * 2
  else:
    if self.heapList[i*2] < self.heapList[i*2+1]:
      return i * 2
    else:
      return i * 2 + 1

Listing 5 所示的是delMin操作的代码。可以看到比较麻烦的地方由一个辅助函数来处理，即percDown。

Listing 5

def delMin(self):
  retval = self.heapList[1]
  self.heapList[1] = self.heapList[self.currentSize]
  self.currentSize = self.currentSize - 1
  self.heapList.pop()
  self.percDown(1)
  return retval

关于二叉堆的最后一部分便是找到从无序列表生成一个“堆”的方法。我们首先想到的是，将无序列表中的每个元素依次插入到堆中。对于一个排好序的列表，我们可以用二分搜索找到合适的位置，然后在下一个位置插入这个键值到堆中，时间复杂度为O(logn)。另外插入一个元素到列表中需要将列表的一些其他元素移动，为新节点腾出位置，时间复杂度为O(n)。因此用insert方法的总开销是O(nlogn)。其实我们能直接将整个列表生成堆，将总开销控制在O(n)。Listing 6 所示的是生成堆的操作。

Listing 6

def buildHeap(self,alist):
  i = len(alist) // 2
  self.currentSize = len(alist)
  self.heapList = [0] + alist[:]
  while (i > 0):
    self.percDown(i)
    i = i - 1

Python實作二元堆的方法

图 5：将列表[ 9, 6, 5, 2, 3]生成一个二叉堆

图 5 所示的是利用buildHeap方法将最开始的树[ 9, 6, 5, 2, 3]中的节点移动到正确的位置时所做的交换操作。尽管我们从树中间开始，然后回溯到根节点，但percDown方法保证了最大子节点总是“下沉”。因为堆是完全二叉树，任何在中间的节点都是叶节点，因此没有子节点。注意，当i=1时，我们从根节点开始下沉，这就需要进行大量的交换操作。可以看到，图 5 最右边的两颗树，首先 9 从根节点的位置移走，移到下一层级之后，percDown进一步检查它此时的子节点，保证它下降到不能再下降为止，即下降到正确的位置。然后进行第二次交换，9 和 3 的交换。由于 9 已经移到了树最底层的层级，便无法进一步交换了。比较一下列表表示法和图 5 所示的树表示法进行的一系列交换还是很有帮助的。

i = 2 [0, 9, 5, 6, 2, 3]
i = 1 [0, 9, 2, 6, 5, 3]
i = 0 [0, 2, 3, 6, 5, 9]

下列所示的代码是完全二叉堆的实现。

def insert(self,k):
   self.heapList.append(k)
   self.currentSize = self.currentSize + 1
   self.percUp(self.currentSize)

  def percDown(self,i):
   while (i * 2) <= self.currentSize:
     mc = self.minChild(i)
     if self.heapList[i] > self.heapList[mc]:
       tmp = self.heapList[i]
       self.heapList[i] = self.heapList[mc]
       self.heapList[mc] = tmp
     i = mc

  def minChild(self,i):
   if i * 2 + 1 > self.currentSize:
     return i * 2
   else:
     if self.heapList[i*2] < self.heapList[i*2+1]:
       return i * 2
     else:
       return i * 2 + 1

  def delMin(self):
   retval = self.heapList[1]
   self.heapList[1] = self.heapList[self.currentSize]
   self.currentSize = self.currentSize - 1

能在O(n)的开销下能生成二叉堆看起来有点不可思议，其证明超出了本书的范围。但是，要理解用O(n)的开销能生成堆的关键是因为logn因子基于树的高度。而对于buildHeap里的许多操作，树的高度比logn要小。

以上是Python實作二元堆的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Python中如何實現工廠模式？May 16, 2025 pm 12:39 PM

在Python中實現工廠模式可以通過創建一個統一的接口來創建不同類型的對象。具體步驟如下：1.定義一個基礎類和多個繼承類，如Vehicle、Car、Plane和Train。 2.創建一個工廠類VehicleFactory，使用create_vehicle方法根據類型參數返回相應的對象實例。 3.通過工廠類實例化對象，如my_car=factory.create_vehicle("car","Tesla")。這種模式提高了代碼的可擴展性和可維護性，但需注意其複雜

python中r是什麼意思 python原始字符串前綴May 16, 2025 pm 12:36 PM

在Python中，r或R前綴用於定義原始字符串，忽略所有轉義字符，讓字符串按字面意思解釋。 1)適用於處理正則表達式和文件路徑，避免轉義字符誤解。 2)不適用於需要保留轉義字符的情況，如換行符。使用時需謹慎檢查，以防意外的輸出。

Python中如何使用__del__方法清理資源？May 16, 2025 pm 12:33 PM

在Python中，__del__方法是對象的析構函數，用於清理資源。 1)不確定的執行時間：依賴垃圾回收機制。 2)循環引用：可能導致無法及時調用，使用weakref模塊處理。 3)異常處理：在__del__中拋出的異常可能被忽略，使用try-except塊捕獲。 4)資源管理的最佳實踐：推薦使用with語句和上下文管理器管理資源。

python中pop()函數的用法 python列表pop元素移除方法詳解May 16, 2025 pm 12:30 PM

pop()函數在Python中用於從列表中移除並返回指定位置的元素。 1)不指定索引時，pop()默認移除並返回列表的最後一個元素。 2)指定索引時，pop()移除並返回該索引位置的元素。 3)使用時需注意索引錯誤、性能問題、替代方法和列表的可變性。

如何用Python進行圖像處理？May 16, 2025 pm 12:27 PM

Python進行圖像處理主要使用Pillow和OpenCV兩大庫。 Pillow適合簡單圖像處理，如加水印，代碼簡潔易用；OpenCV適用於復雜圖像處理和計算機視覺，如邊緣檢測，性能優越但需注意內存管理。

Python中怎樣實現主成分分析？May 16, 2025 pm 12:24 PM

在Python中實現PCA可以通過手動編寫代碼或使用scikit-learn庫。手動實現PCA包括以下步驟：1)中心化數據，2)計算協方差矩陣，3)計算特徵值和特徵向量，4)排序並選擇主成分，5)投影數據到新空間。手動實現有助於深入理解算法，但scikit-learn提供更便捷的功能。

怎樣用Python計算對數？May 16, 2025 pm 12:21 PM

在Python中計算對數是一件非常簡單卻又充滿趣味的事情。讓我們從最基本的問題開始：怎樣用Python計算對數？用Python計算對數的基本方法Python的math模塊提供了計算對數的函數。讓我們來看一個簡單的例子：importmath#計算自然對數（底數為e）x=10natural_log=math.log(x)print(f"自然對數log({x})={natural_log}")#計算以10為底的對數log_base_10=math.log10(x)pri

Python中如何實現線性回歸？May 16, 2025 pm 12:18 PM

要在Python中實現線性回歸，我們可以從多個角度出發。這不僅僅是一個簡單的函數調用，而是涉及到統計學、數學優化和機器學習的綜合應用。讓我們深入探討一下這個過程。在Python中實現線性回歸最常見的方法是使用scikit-learn庫，它提供了簡便且高效的工具。然而，如果我們想要更深入地理解線性回歸的原理和實現細節，我們也可以從頭開始編寫自己的線性回歸算法。使用scikit-learn實現線性回歸scikit-learn庫封裝了線性回歸的實現，使得我們可以輕鬆地進行建模和預測。下面是一個使用sc

See all articles