日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python 的 heapq 模块源码分析

發布時間:2024/9/15 python 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python 的 heapq 模块源码分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者:weapon

來源:https://zhuanlan.zhihu.com/p/54260935

起步

heapq 模塊實現了適用于Python列表的最小堆排序算法。

堆是一個樹狀的數據結構,其中的子節點都與父母排序順序關系。因為堆排序中的樹是滿二叉樹,因此可以用列表來表示樹的結構,使得元素 N 的子元素位于 2N + 1 和 2N + 2 的位置(對于從零開始的索引)。

本文內容將分為三個部分,第一個部分簡單介紹 heapq 模塊的使用;第二部分回顧堆排序算法;第三部分分析heapq中的實現。

heapq 的使用

創建堆有兩個基本的方法:heappush() 和 heapify(),取出堆頂元素用 heappop()。

heappush() 是用來向已有的堆中添加元素,一般從空列表開始構建:

import?heapqdata?=?[97,?38,?27,?50,?76,?65,?49,?13] heap?=?[]for?n?in?data:heapq.heappush(heap,?n)print('pop:',?heapq.heappop(heap))?#?pop:?13 print(heap)?#?[27,?50,?38,?97,?76,?65,?49]

如果數據已經在列表中,則使用 heapify() 進行重排:

import?heapqdata?=?[97,?38,?27,?50,?76,?65,?49,?13]heapq.heapify(data)print('pop:',?heapq.heappop(data))?#?pop:?13 print(data)?#?[27,?38,?49,?50,?76,?65,?97]

回顧堆排序算法

堆排序算法基本思想是:將無序序列建成一個堆,得到關鍵字最小(或最大的記錄;輸出堆頂的最小 (大)值后,使剩余的 n-1 個元素 重又建成一個堆,則可得到n個元素的次小值 ;重復執行,得到一個有序序列,這個就是堆排序的過程。

堆排序需要解決兩個問題:

  • 如何由一個無序序列建立成一個堆?

  • 如何在輸出堆頂元素之后,調整剩余元素,使之成為一個新的堆?

  • 新添加元素和,如何調整堆?

  • 先來看看第二個問題的解決方法。采用的方法叫“篩選”,當輸出堆頂元素之后,就將堆中最后一個元素代替之;然后將根結點值與左、右子樹的根結點值進行比較 ,并與其中小者進行交換;重復上述操作,直至葉子結點,將得到新的堆,稱這個從堆頂至葉子的調整過程為“篩選”。


    如上圖所示,當堆頂 13 輸出后,將堆中末尾的 97 替代為堆頂,然后堆頂與它的子節點 38 和 27 中的小者交換;元素 97 在新的位置上在和它的子節點 65 和 49 中的小者交換;直到元素97成為葉節點,就得到了新的堆。這個過程也叫 下沉 。

    讓堆中位置為 pos 元素進行下沉的如下:

    def?heapdown(heap,?pos):endpos?=?len(heap)while?pos?<?endpos:lchild?=?2?*?pos?+?1rchild?=?2?*?pos?+?2if?lchild?>=?endpos:?#?如果pos已經是葉節點,退出循環breakchildpos?=?lchild???#?假設要交換的節點是左節點if?rchild?<?endpos?and?heap[childpos]?>?heap[rchild]:childpos?=?rchildif?heap[pos]?<?heap[childpos]:?#?如果節點比子節點都小,退出循環breakheap[pos],?heap[childpos]??=?heap[childpos],?heap[pos]??#?交換pos?=?childpos

    再來看看如何解決第三個問題:新添加元素和,如何調整堆?這個的方法正好與 下沉 相反,首先將新元素放置列表的最后,然后新元素與其父節點比較,若比父節點小,與父節點交換;重復過程直到比父節點大或到根節點。這個過程使得元素從底部不斷上升,從下至上恢復堆的順序,稱為 上浮 。

    將位置為 pos 進行上浮的代碼為:

    def?heapup(heap,?startpos,?pos):???#?如果是新增元素,startpos?傳入?0while?pos?>?startpos:parentpos?=?(pos?-?1)?//?2if?heap[pos]?<?heap[parentpos]:heap[pos],?heap[parentpos]?=?heap[parentpos],?heap[pos]pos?=?parentposelse:break

    第一個問題:如何由一個無序序列建立成一個堆?從無序序列的第 n/2 個元素 (即此無序序列對應的完全二叉樹的最后一個非終端結點 )起 ,至第一個元素止,依次進行下沉:


    for?i?in?reversed(range(len(data)?//?2)):heapdown(data,?i)

    heapq 源碼分析

    添加新元素到堆中的 heappush() 函數:

    def?heappush(heap,?item):"""Push?item?onto?heap,?maintaining?the?heap?invariant."""heap.append(item)_siftdown(heap,?0,?len(heap)-1)

    把目標元素放置列表最后,然后進行上浮。盡管它命名叫 down ,但這個過程是上浮的過程,這個命名也讓我困惑,后來我才知道它是因為元素的索引不斷減小,所以命名 down 。下沉的過程它也就命名為 up 了。

    def?_siftdown(heap,?startpos,?pos):newitem?=?heap[pos]#?Follow?the?path?to?the?root,?moving?parents?down?until?finding?a?place#?newitem?fits.while?pos?>?startpos:parentpos?=?(pos?-?1)?>>?1parent?=?heap[parentpos]if?newitem?<?parent:heap[pos]?=?parentpos?=?parentposcontinuebreakheap[pos]?=?newitem

    一樣是通過 newitem 不斷與父節點比較。不一樣的是這里缺少了元素交換的過程,而是計算出新元素最后所在的位置 pos并進行的賦值。顯然這是優化后的代碼,減少了不斷交換元素的冗余過程。

    再來看看輸出堆頂元素的函數 heappop():

    def?heappop(heap):"""Pop?the?smallest?item?off?the?heap,?maintaining?the?heap?invariant."""lastelt?=?heap.pop()????#?raises?appropriate?IndexError?if?heap?is?emptyif?heap:returnitem?=?heap[0]heap[0]?=?lastelt_siftup(heap,?0)return?returnitemreturn?lastelt

    通過 heap.pop() 獲得列表中的最后一個元素,然后替換為堆頂 heap[0] = lastelt ,再進行下沉:

    def?_siftup(heap,?pos):endpos?=?len(heap)startpos?=?posnewitem?=?heap[pos]#?Bubble?up?the?smaller?child?until?hitting?a?leaf.childpos?=?2*pos?+?1????#?左節點,默認替換左節點while?childpos?<?endpos:#?Set?childpos?to?index?of?smaller?child.rightpos?=?childpos?+?1??#?右節點if?rightpos?<?endpos?and?not?heap[childpos]?<?heap[rightpos]:childpos?=?rightpos??#?當右節點比較小時,應交換的是右節點#?Move?the?smaller?child?up.heap[pos]?=?heap[childpos]pos?=?childposchildpos?=?2*pos?+?1#?The?leaf?at?pos?is?empty?now.??Put?newitem?there,?and?bubble?it?up#?to?its?final?resting?place?(by?sifting?its?parents?down).heap[pos]?=?newitem_siftdown(heap,?startpos,?pos)

    這邊的代碼將準備要下沉的元素視為新元素 newitem ,將其當前的位置 pos 視為空位置,由其子節點中的小者進行取代,反復如此,最后會在葉節點留出一個位置,這個位置放入 newitem ,再讓新元素進行上浮。

    再來看看讓無序數列重排成堆的 heapify() 函數:

    def?heapify(x):"""Transform?list?into?a?heap,?in-place,?in?O(len(x))?time."""n?=?len(x)for?i?in?reversed(range(n//2)):_siftup(x,?i)

    這部分就和理論上的一致,從最后一個非葉節點 (n // 2) 到根節點為止,進行下沉。

    總結

    堆排序結合圖來理解還是比較好理解的。這種數據結構常用于優先隊列(標準庫Queue的優先隊列用的就是堆)。heapq模塊中還有很多其他 heapreplace ,heappushpop 等大體上都很類似。

    ? ???精 彩 文 章?

    • Python進階:enum模塊源碼分析

    • 超好看的弦圖,Python一行代碼就能做

    • seaborn常用的10種數據分析圖表

    END

    來和小伙伴們一起向上生長呀~~~

    掃描下方二維碼,添加小詹微信,可領取千元大禮包并申請加入 Python學習交流群,群內僅供學術交流,日常互動,如果是想發推文、廣告、砍價小程序的敬請繞道!一定記得備注「交流學習」,我會盡快通過好友申請哦!

    (添加人數較多,請耐心等待)

    (掃碼回復 1024? 即可領取IT資料包)

    總結

    以上是生活随笔為你收集整理的Python 的 heapq 模块源码分析的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。