日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python字典和集合对象可以进行索引_Python字典和集合

發布時間:2023/12/4 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python字典和集合对象可以进行索引_Python字典和集合 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、泛映射類型

collections.abc 模塊中有 Mapping 和 MutableMapping 這兩個抽象類,他們的作用是為dict和其他類似的類型定義形式接口。

標準庫里所有映射類型都是利用dict來實現的,因此他們有個共同的限制,只有可散列的數據類型才能用作這些映射里的鍵。

可散列的數據類型:在這個對象的生命周期中,他的散列值是不變的,而且這個對象需要實現__hash__()方法,還要有__eq__()方法。

▲ 原子不可變數據類型(str、bytes和數值類型)、frozenset都是可散列類型。

▲ 只有當一個元組包含的所有元素都是可散列類型的情況下,它才是可散列的。

字典提供了多種構造方法:

>>> a = dict(name='Li', sex='girl')

>>> b = {'name':'Li', 'sex':'girl'}

>>> c = dict(zip(['name','sex'], ['Li','girl']))

>>> d = dict([('name':'Li'), ('sex':'girl')])

>>> e = dict({'name':'Li', 'sex':'girl'})

>>> a == b == c == d == e

True

2、字典推導、默認值

2.1、字典推導

從任何以鍵值對作為元素的可迭代對象中構建出字典。

>>> DIAL_CODE = [

... (86,'China'),

... (1,'United States'),

... ]

>>> country_code = {country:code for code,country in DIAL_CODE}

{'China': 86, 'United States': 1}

>>> {country:code for country,code in country_code.items() if code > 50}

{'China': 86}

2.2、用setdefault處理找不到的鍵

在不進行二次查找的情況下更新列表

my_dict.setdefault(key, []).append(new_value)

# 等于

if key not in my_dict:

my_dict[key] = []

my_dict[key].append(new_value)

3、映射的彈性鍵查詢

某個鍵在映射中不存在時,我們也希望通過這個鍵讀取值的時候能得到一個默認值。

可以使用defaultdict類型,或者自定義一個dict的子類,實現__missing__方法。

▲、在實例化一個defaultdict的時候,需要給構造方法提供一個可調用對象,這個可調用對象會在__getitem__找不到鍵的時候被調用,讓__getitem__返回某種默認值。

如:dd = defaultdict(list) , dd['new_key']

如果new_key在dd中不存在,表達式dd['new_key']會按如下步驟執行:

(1)、調用list() 建立一個新列表。

(2)、把這個新列表作為值,‘new_key’作為鍵,放到dd中。

(3)、返回這個列表的引用。

▲、這個用來生成默認值 list 的可調用對象存放在名為 default_factory的實例屬性里。

▲、如果在創建defaultdict時沒有指定 default_factory,查詢不存在鍵會觸發keyError 。

▲、defaultdict 里的 default_factory,只會在__getitem__里被調用(dd[k]),而dd.get(k)則會返回None。

特殊方法__missing__,只會被__getitem__調用。

提供__missing__方法對get或者__contains__(in 運算符會用到這個方法)這些方法的使用沒有影響。

4、字典的變種

collections.OrderedDict:添加鍵的時候后會保持順序

>>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

>>> OrderedDict(sorted(d.items(), key=lambda t: t[0]))

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

collections.ChainMap:容納不同的映射對象,查找操作時,這些對象被當作一個整體被逐個查找。

collections.Counter:整數計數器。 元素被存儲為字典鍵,它們的計數被存儲為字典值。

collections.USerDict:讓用戶繼承寫子類。對一個字典對象的封裝。其實例的內容保存在一個普通的字典當中,可以通過 UserDict 實例的屬性 data 訪問。

5、不可變映射類型

types模塊引入了一個封裝類名叫MappingProxyType。如果給這個類一個映射,它會返回一個只讀的映射視圖。

>>> from types import MappingProxyType

>>> d = {'1':'one'}

>>> d_proxy = MappingProxyType(d)

>>> d_proxy

mappingproxy({'1': 'one'})

>>> d_proxy['1']

'one'

>>> d_proxy['2'] = 'two'

Traceback (most recent call last):

File "", line 1, in

TypeError: 'mappingproxy' object does not support item assignment

>>> d['2'] = 'two'

>>> d_proxy

mappingproxy({'2': 'two', '1': 'one'})

6、集合論

集合的本質是許多唯一對象的聚集。所以,集合可以用于去重。

集合中的元素必須是可散列的,set類型本身是不可散列的,但是forzenset可以。所以可以創建一個包含不同frozenset的set。

空集合:set()

集合同樣有屬于他的集合推導。

>>> from unicodedata import name

>>> {chr(i) for i in range(32,256) if 'SIGN' in name(chr(i),'')}

{'\xa2', '\xac', '§', '±', '\xa9', '\xb5', '\xae', '°', '$', '\xa3', '=', '+', '¤', '%', '÷', '<', '\xa5', '\xb6', '>', '#', '×'}

7、字典中的散列表

散列表是一個稀疏數組(總是有空白元素的數組)。散列表里的單元叫做表元。

在dict的散列表中,每一個鍵值對都占用一個表元,每個表元都有兩個部分,一個是對鍵的引用,另一個是對值得引用。

所有表元的大小一致,所以可以通過偏移量來讀取某個表元。

Python會設法保證大概還有三分之一的表元是空的,在快要達到閾值的時候,原有的散列表會被復制到一個更大的空間里面。

如果要把一個對象放入散列表,那么首先要計算這個元素鍵的散列值。

內置的hash()方法用于所有內置對象,自定義對象調用hash()實際上運行自定義的__hash__。

如果兩個對象在比較時是相等的,那他們的散列值必須相等。如(1 == 1.0)

▲ 散列值在索引空間中盡量分散開,越是相似的但不相等的對象,散列值的差別應該越大。如(1.0001和1.0002)

散列表算法:為了獲取my_dict[search_key]的值

(1)首先調用hash(search_key)計算search_key的散列值,把這個值最低幾位數字當做偏移量,在散列表里查找表元。

(2)若找到的表元是空的,拋出KeyError異常

(3)若不為空,表元里會有一對found_key:found_value。進行檢驗search_key == found_key是否為真

(4)相等則返回found_value。不相等則稱為散列沖突。

為了解決散列沖突,算法會在散列值中另外再取幾位經過計算處理,把新得到的數字再當做索引來尋找表元。

一個可散列對象必須滿足以下條件:

(1)支持hash()函數,并且通過__hash__()方法得到的散列值是不變的。

(2)通過__eq__()方法檢測相等性。

(3)若a == b為真,則hash(a) == hash(b)也為真。

所有由用戶自定義的對象默認都是可散列的。因為他們的散列值由id()來獲取,而且他們都不相等。

▲ 字典在內存中開銷巨大,典型的空間換時間。

▲ 鍵的次序取決于添加順序

▲ 往字典添加新鍵可能會改變已有鍵的順序(字典擴容決定)

set的實現:也依賴散列表,散列表里存放的只有元素的引用

集合里的元素必須是可散列的。

集合很消耗內存。

可以很高效地判斷元素是否存在于某個集合

元素的次序取決于被添加到集合里的次序

往集合里添加元素,可能會改變集合里已有元素的次序。

總結

以上是生活随笔為你收集整理的python字典和集合对象可以进行索引_Python字典和集合的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。