collections 是Python 的一個內建模組,所謂內建模組的意思是指Python 內部封裝好的模組,無需安裝即可直接使用。
Python 提供了很多非常好用的基本類型,例如不可變類型tuple,我們可以輕鬆地用它來表示一個二元向量。
namedtuple 是一個函數,它用來建立一個自訂的 tuple 對象,並且規定了 tuple 元素的個數,並且可以用屬性而不是索引來引用 tuple 的某個元素。
如此一來,我們用 namedtuple 可以很方便地定義一種資料類型,它具備 tuple 的不變性,又可以根據屬性來引用,使用十分方便。
本範例中我們使用了一個三維座標 x,y,z 來定義一個 tuple 對象,而物件元素有3個,然後透過座標值來引用對應的值即可。
from collections import namedtuple from collections import deque from collections import defaultdict from collections import OrderedDict from collections import Counter def testNamedTuple(): vector=namedtuple('vector',['x','y','z']) flag=vector(3,4,5) print(type(flag)) print(isinstance(flag,vector)) print(isinstance(flag,tuple)) #通过这里的判定我们就可以知晓它是元组类型 print(flag.x,flag.y,flag.z)
deque是堆疊和佇列的一種廣義實現,deque是 "double-end queue" 的簡稱。
deque支援線程安全、有效內存地以近似O(1)的性能在deque 的兩端插入和刪除元素,儘管list 也支援相似的操作,但是它主要在固定長度操作上的優化,從而在pop(0) 和insert(0,v)(會改變資料的位置和大小)上有O(n)的時間複雜度。
在資料結構中,我們知道佇列和堆疊是兩個非常重要的資料類型,一個先進先出,一個後進先出。
在python 中,使用list 存儲數據時,按索引訪問元素很快,但是插入和刪除元素就很慢,因為list 是線性存儲,數據量大的時候,插入和刪除效率很低。
deque是為了有效率地實現插入和刪除操作的雙向鍊錶結構,非常適合實現佇列和堆疊這樣的資料結構。
def testDeque(): list1=[x*x for x in range(101)] delist=deque(list1) #对列表进行了一次再处理,让list1列表变成了双向链表结构 delist.append(1000)#将x添加到deque的右侧 delist.appendleft(2000)#将x添加到deque的左侧 delist.pop(1000)#移除和返回deque中最右侧的元素,如果没有元素,将会报出IndexError; delist.popleft()#移除和返回deque中最左侧的元素,如果没有元素,将会报出IndexError; delist.count(1)#返回deque中元素等于1的个数 delist.remove(10000)#移除第一次出现的value,如果没有找到,报出ValueError; delist.reverse()#反转deque中的元素,并返回None; list2=[1,3,4,5] delist.extend(list2)#将可迭代变量iterable中的元素添加至deque的右侧 delist.extendleft(list2)#将变量iterable中的元素添加至deque的左侧,往左侧添加序列的顺序与可迭代变量iterable中的元素相反 delist.maxlen()#只读的属性,deque的最大长度,如果无解,就返回None delist.rotate(1)#从右侧反转n步,如果n为负数,则从左侧反转 delist.clear()#将deque中的元素全部删除,最后长度为0;
defaultdict是內建資料類型dict 的子類,基本功能與dict 一樣,只是重寫了一個方法__missing__(key)和增加了一個可寫的物件變數default_factory。
使用 dict 字典型別時,如果引用的 key 不存在,就會拋出 KeyError。如果希望 Key 不存在時,傳回一個預設值,就可以用 defaultdict。
def testDefaultdict(): dict1= defaultdict(lambda: 'default') #Key不存在时,返回一个默认值,就可以用default,defaultdict的其他行为跟dict是完全一样的 dict1["k1"]="v1" print(dict1["k2"]) list2= [('yellow',11),('blue',2),('yellow',3),('blue',4),('red',5),('red',10)] dict1 = defaultdict(list)#使用list作为default_factory,很容易将一个key-value的序列转换为一个关于list的词典 for k,v in list2: dict1[k].append(v) print(dict1)
OrderedDict類似於正常的字典,只是它記住了元素插入的順序,當在有序的字典上迭代時,返回的元素就是它們第一次新增的順序。這樣 dict 就是一個有秩序的字典。
使用 dict 時,key 是無序的。在對 dict 做迭代時,我們無法確定 key 的順序。但如果想要保持 key 的順序,可以用 OrderedDict。
def testOrderedDict(): dict1=dict([('aaa', 111), ('ddd',444),('bbb', 222), ('ccc', 333)]) print(dict1) dict2 = OrderedDict([('ddd',444),('aaa', 111), ('bbb', 222), ('ccc', 333)])#OrderedDict的key会按照插入的顺序排列,不是key本身排序 print(dict2) dict3 = {"banana": 33, "apple": 222, "pear": 1, "orange": 4444} # dict sorted by key dict4=OrderedDict(sorted(dict3.items(), key=lambda t: t[0])) print("dict4",dict4) # dict sorted by value dict5=OrderedDict(sorted(dict3.items(), key=lambda t: t[1])) print("dict5",dict5) # dict sorted by length of key string dict6 = OrderedDict(sorted(dict3.items(), key=lambda t: len(t[0]))) print("dict6",dict6) print(dict6['apple'])
def testCounter(): '''counter可以支持方便、快速的计数''' str1="abcdefgabcedergeghdjlkabcdefe" #将可迭代的字符串初始化counter str2=Counter(str1) print(str2) #从输出的内容来看,Counter实际上也是dict的一个子类 for k,v in str2.items(): print(k,v) dict3 = {"banana": 33, "apple": 222, "pear": 1, "orange": 4444,"apples":2}#将dict初始化counter dict4=Counter(dict3) print(dict4) print(dict4["test"])#Counter对象类似于字典,如果某个项缺失,会返回0,而不是报出KeyError; dict5=Counter(high=9,age=33,money=-1)#将args初始化counter print(dict5) #elements返回一个迭代器,每个元素重复的次数为它的数目,顺序是任意的顺序,如果一个元素的数目少于1,那么elements()就会忽略它; list1=list(dict5.elements()) print(list1) #most_common返回一个列表,包含counter中n个最大数目的元素 #,如果忽略n或者为None,most_common()将会返回counter中的所有元素,元素有着相同数目的将会以任意顺序排列; str1 = "abcdefgabcedergeghdjlkabcdefe" list1=Counter(str1).most_common(3) print(list1) if __name__ == '__main__': # testNamedTuple() # testCounter() testDefaultdict() # testDeque() # testOrderedDict()
以上是聊聊Python的一個內建模組Collections的詳細內容。更多資訊請關注PHP中文網其他相關文章!