python数据结构之 set
?
在數(shù)學(xué)概念中,被意為整合元素的定義區(qū)域
在python中,set最大的作用是用來(lái)去重
?
set常見(jiàn)操作:
In [158]: s ={1,1,1,1,2,22,33,3,3,3}
?
In [159]: s
Out[159]: {1,2, 3, 22, 33}
?
在定義一個(gè)集合的時(shí)候,只能使用大括號(hào)定義最少一個(gè)值,不然會(huì)被認(rèn)為字典進(jìn)行定義
在set中不能加入不可哈希的對(duì)象類型
?
In [161]:hash('a')
Out[161]:4952964627402403516
?
查看列表的哈希值,可以發(fā)現(xiàn)這個(gè)對(duì)象不可被哈希
In [162]: a =[1,2,3]
?
In [163]:hash(a)
---------------------------------------------------------------------------
TypeError?? ? ? ? ? ? ? ? ? ? ?? ? ? ? ?Traceback (most recent call last)
<ipython-input-163-fe724719d9a1>in <module>()
----> 1hash(a)
?
TypeError:unhashable type: 'list'
?
set元素必須是可以哈希運(yùn)算,但是需要元素可以迭代的
只要是能被迭代的元素都可以被加入到set中
In [171]:list(s)
Out[171]:['abc', b'abc']
?
In [172]: a =list(s)
?
In [173]: a
Out[173]:['abc', b'abc']
?
In [174]:set(a)
Out[174]:{'abc', b'abc'}
?
set.add增加元素
增加一個(gè)元素到set中,如果存在則什么都不做,因?yàn)榇嬖谄渲?/span>
In [176]:s.add(1)
?
In [177]: s
Out[177]: {1,'abc', b'abc'}
?
In [178]:s.add(2)
?
In [179]: s
Out[179]: {1,'abc', 2, b'abc'}
set可以收集多個(gè)集合,同樣的可以合并多個(gè)集合
?
使用update進(jìn)行更新
?
In [180]:s.update({1,2,3},{5,7},(1,9,1))
In [181]: s
Out[181]: {1,'abc', 2, b'abc', 3, 5, 7, 9}
?
In [185]:s.update({1})
?
In [186]: s
Out[186]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9}
?
In [187]:s.update({10})
?
In [188]: s
Out[188]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9, 10}
?
set.remove刪除
remove,將要?jiǎng)h除的值轉(zhuǎn)為hash,并按當(dāng)前hash值定位其位置進(jìn)行刪除,這個(gè)hash將作為一個(gè)key進(jìn)行操作
?
In [193]: s
Out[193]: {1,2, b'abc', 3, 5, 7, 4, 9, 10}
?
In [194]:s.remove(b'abc')
?
In [195]: s
Out[195]: {1,2, 3, 4, 5, 7, 9, 10}
?
查找元素的過(guò)程是非常快,因?yàn)槭侵苯佣xhash,并非是從頭到尾去遍歷
?
discard 從集合移除一個(gè)元素
與remove功能一樣,但是discard并不會(huì)彈出異常:
remove 刪除一個(gè)異常索引會(huì)報(bào)出keyerror
In [196]:s.remove('hahaha')
---------------------------------------------------------------------------
KeyError?? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? Traceback (most recent call last)
<ipython-input-196-185a5cf4c543>in <module>()
----> 1s.remove('hahaha')
?
KeyError:'hahaha'
?
discard 刪除一個(gè)索引則不會(huì)返回任何信息
In [197]:s.discard('hahaha')
?
In [198]:
?
pop ?隨機(jī)挑選一個(gè)彈出并返回
pop只是隨機(jī)彈出,并不能跟參數(shù)
In [202]:s.pop()
Out[202]: 2
?
In [203]:s.pop()
Out[203]: 3
?
In [204]: s
Out[204]: {4,5, 7, 9, 10}
?
clear ?清除集合內(nèi)所有元素,但是要考慮GC內(nèi)存回收問(wèn)題
?
set修改及查詢
在set中沒(méi)有修改的概念,只有兩種操作:
刪除元素 和追加元素
查詢:非線性結(jié)構(gòu),無(wú)法進(jìn)行索引查詢
遍歷:可以遍歷所有可迭代的元素
?
成員運(yùn)算符
成員運(yùn)算符 in , not in ,效率很高
非線性結(jié)構(gòu)如果找哈希值,時(shí)間復(fù)雜度相當(dāng)于索引遍歷列表大O(1)
看似通過(guò)值在遍歷,實(shí)際上是用哈希值進(jìn)行定位
?
可哈希的類型
數(shù)值型:int、float、complex
布爾類:True、False
字符串: str Bytes
Tuple、None都是不可變類型,稱為哈希類型
?
對(duì)比list和set執(zhí)行效率
?
查看set執(zhí)行效率
導(dǎo)入模塊timeit
import timeit
?
In [3]:%%timeit lst1 = set(range(1000))
??...: a = -1 in lst1
??...:
?
38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)
?
查看list效率
In [1]:%%timeit lst1 = list(range(1000))
??...: a = -1 in lst1
??...:
14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
總結(jié):
線性結(jié)構(gòu)查詢的復(fù)雜度是O(n),?隨著規(guī)模增大耗時(shí)間越來(lái)越高
set和字典都屬于特殊結(jié)構(gòu),其中都存了hash作為key,時(shí)間復(fù)雜度可以做到O(1),查詢時(shí)間與數(shù)據(jù)規(guī)模無(wú)關(guān)
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的python数据结构之 set的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: DRBD+keepalived+LAMP
- 下一篇: python基础:字典的使用