Java中常见数据结构Map之LinkedHashMap
1, LinkedHashMap基本結(jié)構(gòu) LinkedHashMap是HashMap的一個(gè)子類,它保留插入的順序,如果需要輸出的順序和輸入時(shí)的相同,那么就選用LinkedHashMap。 LinkedHashMap是Map接口的哈希表和鏈接列表實(shí)現(xiàn),具有可預(yù)知的迭代順序。此實(shí)現(xiàn)提供所有可選的映射操作,并允許使用null值和null鍵。此類不保證映射的順序,特別是它不保證該順序恒久不變。 LinkedHashMap實(shí)現(xiàn)與HashMap的不同之處在于,后者維護(hù)著一個(gè)運(yùn)行于所有條目的雙重鏈接列表。此鏈接列表定義了迭代順序,該迭代順序可以是插入順序或者是訪問(wèn)順序。 注意,此實(shí)現(xiàn)不是同步的。如果多個(gè)線程同時(shí)訪問(wèn)鏈接的哈希映射,而其中至少一個(gè)線程從結(jié)構(gòu)上修改了該映射,則它必須保持外部同步。
?
根據(jù)鏈表中元素的順序可以分為:按插入順序的鏈表,和按訪問(wèn)順序(調(diào)用get方法)的鏈表。?
默認(rèn)是按插入順序排序,如果指定按訪問(wèn)順序排序,那么調(diào)用get方法后,會(huì)將這次訪問(wèn)的元素移至鏈表尾部,不斷訪問(wèn)可以形成按訪問(wèn)順序排序的鏈表。? 可以重寫removeEldestEntry方法返回true值指定插入元素時(shí)移除最老的元素。(以下源碼截圖皆為JDK7) LinkedHashMap是繼承HashMap, 也就是說(shuō)LinkedHashMap的結(jié)構(gòu)也是和HashMap那樣(數(shù)組+鏈表)。 LinkedHashMap最大的差別在于Entry的定義上: 這里維護(hù)了一個(gè)before和after的Entry, 見(jiàn)名思意, 就是每個(gè)Entry<K,V>都維護(hù)它的上一個(gè)元素和下一個(gè)元素的關(guān)系。這也是LinkedHashMap有序的關(guān)鍵所在。 接著我們?cè)倏聪耯eader的定義: 上圖可以看出header的hash值為-1, 所以并不在hash表的table上。 其實(shí)header就是為了記錄雙向鏈表的頭結(jié)點(diǎn)和尾節(jié)點(diǎn)。 LinkedHashMap的元素關(guān)系如下: 2, LinkedHashMap中主要方法介紹
LinkedHashMap中重寫的方法不是很多, 請(qǐng)看下圖: 以下部分截取自: http://www.cnblogs.com/xiaoxi/p/6170590.html?? 感謝原作者, 寫的確實(shí)很好。???? 假如有這么一段代碼:
首先是第3行~第4行,new一個(gè)LinkedHashMap出來(lái),看一下做了什么:
通過(guò)源代碼可以看出,在LinkedHashMap的構(gòu)造方法中,實(shí)際調(diào)用了父類HashMap的相關(guān)構(gòu)造方法來(lái)構(gòu)造一個(gè)底層存放的table數(shù)組。
我們已經(jīng)知道LinkedHashMap的Entry元素繼承HashMap的Entry,提供了雙向鏈表的功能。在上述HashMap的構(gòu)造器中,最后會(huì)調(diào)用init()方法,進(jìn)行相關(guān)的初始化,這個(gè)方法在HashMap的實(shí)現(xiàn)中并無(wú)意義,只是提供給子類實(shí)現(xiàn)相關(guān)的初始化調(diào)用。
LinkedHashMap重寫了init()方法,在調(diào)用父類的構(gòu)造方法完成構(gòu)造后,進(jìn)一步實(shí)現(xiàn)了對(duì)其元素Entry的初始化操作。
這里出現(xiàn)了第一個(gè)多態(tài):init()方法。盡管init()方法定義在HashMap中,但是由于:
1、LinkedHashMap重寫了init方法
2、實(shí)例化出來(lái)的是LinkedHashMap
因此實(shí)際調(diào)用的init方法是LinkedHashMap重寫的init方法。假設(shè)header的地址是0x00000000,那么初始化完畢,實(shí)際上是這樣的:
注意這個(gè)header,hash值為-1,其他都為null,也就是說(shuō)這個(gè)header不放在數(shù)組中,就是用來(lái)指示開(kāi)始元素和標(biāo)志結(jié)束元素的。
header的目的是為了記錄第一個(gè)插入的元素是誰(shuí),在遍歷的時(shí)候能夠找到第一個(gè)元素。
五、LinkedHashMap存儲(chǔ)元素
LinkedHashMap并未重寫父類HashMap的put方法,而是重寫了父類HashMap的put方法調(diào)用的子方法void recordAccess(HashMap m)? ,void addEntry(int hash, K key, V value, int bucketIndex) 和void createEntry(int hash, K key, V value, int bucketIndex),提供了自己特有的雙向鏈接列表的實(shí)現(xiàn)。
繼續(xù)看LinkedHashMap存儲(chǔ)元素,也就是put("111","111")做了什么,首先當(dāng)然是調(diào)用HashMap的put方法:
第23行又是一個(gè)多態(tài),因?yàn)長(zhǎng)inkedHashMap重寫了addEntry方法,因此addEntry調(diào)用的是LinkedHashMap重寫了的方法:
因?yàn)長(zhǎng)inkedHashMap由于其本身維護(hù)了插入的先后順序,因此LinkedHashMap可以用來(lái)做緩存,第7行~第9行是用來(lái)支持FIFO算法的,這里暫時(shí)不用去關(guān)心它。看一下createEntry方法:?
createEntry(int hash,K key,V value,int bucketIndex)方法覆蓋了父類HashMap中的方法。這個(gè)方法不會(huì)拓展table數(shù)組的大小。該方法首先保留table中bucketIndex處的節(jié)點(diǎn),然后調(diào)用Entry的構(gòu)造方法(將調(diào)用到父類HashMap.Entry的構(gòu)造方法)添加一個(gè)節(jié)點(diǎn),即將當(dāng)前節(jié)點(diǎn)的next引用指向table[bucketIndex] 的節(jié)點(diǎn),之后調(diào)用的e.addBefore(header)是修改鏈表,將e節(jié)點(diǎn)添加到header節(jié)點(diǎn)之前。
第2行~第4行的代碼和HashMap沒(méi)有什么不同,新添加的元素放在table[i]上,差別在于LinkedHashMap還做了addBefore操作,這四行代碼的意思就是讓新的Entry和原鏈表生成一個(gè)雙向鏈表。假設(shè)字符串111放在位置table[1]上,生成的Entry地址為0x00000001,那么用圖表示是這樣的:
如果熟悉LinkedList的源碼應(yīng)該不難理解,還是解釋一下,注意下existingEntry表示的是header:
1、after=existingEntry,即新增的Entry的after=header地址,即after=0x00000000
2、before=existingEntry.before,即新增的Entry的before是header的before的地址,header的before此時(shí)是0x00000000,因此新增的Entry的before=0x00000000
3、before.after=this,新增的Entry的before此時(shí)為0x00000000即header,header的after=this,即header的after=0x00000001
4、after.before=this,新增的Entry的after此時(shí)為0x00000000即header,header的before=this,即header的before=0x00000001
這樣,header與新增的Entry的一個(gè)雙向鏈表就形成了。再看,新增了字符串222之后是什么樣的,假設(shè)新增的Entry的地址為0x00000002,生成到table[2]上,用圖表示是這樣的:
?
就不細(xì)解釋了,只要before、after清除地知道代表的是哪個(gè)Entry的就不會(huì)有什么問(wèn)題。
注意,這里的插入有兩重含義:
1.從table的角度看,新的entry需要插入到對(duì)應(yīng)的bucket里,當(dāng)有哈希沖突時(shí),采用頭插法將新的entry插入到?jīng)_突鏈表的頭部。
2.從header的角度看,新的entry需要插入到雙向鏈表的尾部。
3、LinkedHashMap讀取元素
LinkedHashMap重寫了父類HashMap的get方法,實(shí)際在調(diào)用父類getEntry()方法取得查找的元素后,再判斷當(dāng)排序模式accessOrder為true時(shí)(即按訪問(wèn)順序排序),先將當(dāng)前節(jié)點(diǎn)從鏈表中移除,然后再將當(dāng)前節(jié)點(diǎn)插入到鏈表尾部。由于的鏈表的增加、刪除操作是常量級(jí)的,故并不會(huì)帶來(lái)性能的損失。
4、利用LinkedHashMap實(shí)現(xiàn)LRU算法緩存
前面講了LinkedHashMap添加元素,刪除、修改元素就不說(shuō)了,比較簡(jiǎn)單,和HashMap+LinkedList的刪除、修改元素大同小異,下面講一個(gè)新的內(nèi)容。
LinkedHashMap可以用來(lái)作緩存,比方說(shuō)LRUCache,看一下這個(gè)類的代碼,很簡(jiǎn)單,就十幾行而已:
顧名思義,LRUCache就是基于LRU算法的Cache(緩存),這個(gè)類繼承自LinkedHashMap,而類中看到?jīng)]有什么特別的方法,這說(shuō)明LRUCache實(shí)現(xiàn)緩存LRU功能都是源自LinkedHashMap的。LinkedHashMap可以實(shí)現(xiàn)LRU算法的緩存基于兩點(diǎn):
1、LinkedList首先它是一個(gè)Map,Map是基于K-V的,和緩存一致
2、LinkedList提供了一個(gè)boolean值可以讓用戶指定是否實(shí)現(xiàn)LRU
那么,首先我們了解一下什么是LRU:LRU即Least Recently Used,最近最少使用,也就是說(shuō),當(dāng)緩存滿了,會(huì)優(yōu)先淘汰那些最近最不常訪問(wèn)的數(shù)據(jù)。比方說(shuō)數(shù)據(jù)a,1天前訪問(wèn)了;數(shù)據(jù)b,2天前訪問(wèn)了,緩存滿了,優(yōu)先會(huì)淘汰數(shù)據(jù)b。
我們看一下LinkedList帶boolean型參數(shù)的構(gòu)造方法:
就是這個(gè)accessOrder,它表示:
(1)false,所有的Entry按照插入的順序排列
(2)true,所有的Entry按照訪問(wèn)的順序排列
第二點(diǎn)的意思就是,如果有1 2 3這3個(gè)Entry,那么訪問(wèn)了1,就把1移到尾部去,即2 3 1。每次訪問(wèn)都把訪問(wèn)的那個(gè)數(shù)據(jù)移到雙向隊(duì)列的尾部去,那么每次要淘汰數(shù)據(jù)的時(shí)候,雙向隊(duì)列最頭的那個(gè)數(shù)據(jù)不就是最不常訪問(wèn)的那個(gè)數(shù)據(jù)了嗎?換句話說(shuō),雙向鏈表最頭的那個(gè)數(shù)據(jù)就是要淘汰的數(shù)據(jù)。
"訪問(wèn)",這個(gè)詞有兩層意思:
1、根據(jù)Key拿到Value,也就是get方法
2、修改Key對(duì)應(yīng)的Value,也就是put方法
首先看一下get方法,它在LinkedHashMap中被重寫:
然后是put方法,沿用父類HashMap的:
修改數(shù)據(jù)也就是第6行~第14行的代碼。看到兩端代碼都有一個(gè)共同點(diǎn):都調(diào)用了recordAccess方法,且這個(gè)方法是Entry中的方法,也就是說(shuō)每次的recordAccess操作的都是某一個(gè)固定的Entry。
recordAccess,顧名思義,記錄訪問(wèn),也就是說(shuō)你這次訪問(wèn)了雙向鏈表,我就把你記錄下來(lái),怎么記錄?把你訪問(wèn)的Entry移到尾部去。這個(gè)方法在HashMap中是一個(gè)空方法,就是用來(lái)給子類記錄訪問(wèn)用的,看一下LinkedHashMap中的實(shí)現(xiàn):
看到每次recordAccess的時(shí)候做了兩件事情:
1、把待移動(dòng)的Entry的前后Entry相連
2、把待移動(dòng)的Entry移動(dòng)到尾部
當(dāng)然,這一切都是基于accessOrder=true的情況下。最后用一張圖表示一下整個(gè)recordAccess的過(guò)程吧:
void recordAccess(HashMap<K,V> m) 這個(gè)方法就是我們一開(kāi)始說(shuō)的,accessOrder為true時(shí),就是使用的訪問(wèn)順序,訪問(wèn)次數(shù)最少到訪問(wèn)次數(shù)最多,此時(shí)要做特殊處理。處理機(jī)制就是訪問(wèn)了一次,就將自己往后移一位,這里就是先將自己刪除了,然后在把自己添加,這樣,近期訪問(wèn)的少的就在鏈表的開(kāi)始,最近訪問(wèn)的元素就會(huì)在鏈表的末尾。如果為false。那么默認(rèn)就是插入順序,直接通過(guò)鏈表的特點(diǎn)就能依次找到插入元素,不用做特殊處理。
5、代碼演示LinkedHashMap按照訪問(wèn)順序排序的效果
最后代碼演示一下LinkedList按照訪問(wèn)順序排序的效果,驗(yàn)證一下上一部分LinkedHashMap的LRU功能:
注意這里的構(gòu)造方法要用三個(gè)參數(shù)那個(gè)且最后的要傳入true,這樣才表示按照訪問(wèn)順序排序。看一下代碼運(yùn)行結(jié)果:
代碼運(yùn)行結(jié)果證明了兩點(diǎn):
1、LinkedList是有序的
2、每次訪問(wèn)一個(gè)元素(get或put),被訪問(wèn)的元素都被提到最后面去了總結(jié)
以上是生活随笔為你收集整理的Java中常见数据结构Map之LinkedHashMap的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Java类集框架 —— LinkedLi
- 下一篇: Java文件读取 中文乱码