Rumah >pembangunan bahagian belakang >Tutorial Python >Kaunter Python: Bagaimana untuk menggunakan collections.Counter?
Alat pembilang menyediakan pengiraan pantas dan mudah ialah subkelas dict, digunakan untuk mengira objek boleh cincang. Ia ialah koleksi dengan elemen yang disimpan seperti kunci kamus dan dikira sebagai nilai. Kiraan boleh berupa sebarang nilai integer, termasuk 0 dan nombor negatif, dan kelas Counter adalah sedikit seperti beg atau multiset dalam bahasa lain. Ringkasnya, ia boleh dikira secara statistik Mari kita lihat beberapa contoh untuk menjelaskannya.
Contoh:
#计算top10的单词 from collections import Counter import re text = 'remove an existing key one level down remove an existing key one level down' words = re.findall(r'\w+', text) Counter(words).most_common(10) [('remove', 2),('an', 2),('existing', 2),('key', 2),('one', 2)('level', 2),('down', 2)] #计算列表中单词的个数 cnt = Counter() for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']: cnt[word] += 1 cnt Counter({'red': 2, 'blue': 3, 'green': 1}) #上述这样计算有点嘛,下面的方法更简单,直接计算就行 L = ['red', 'blue', 'red', 'green', 'blue', 'blue'] Counter(L) Counter({'red': 2, 'blue': 3, 'green': 1}
Elemen dikira daripada boleh diulang atau dimulakan daripada pemetaan lain (atau pembilang):
from collections import Counter #字符串计数 Counter('gallahad') Counter({'g': 1, 'a': 3, 'l': 2, 'h': 1, 'd': 1}) #字典计数 Counter({'red': 4, 'blue': 2}) Counter({'red': 4, 'blue': 2}) #计数 Counter(cats=4, dogs=8) Counter({'cats': 4, 'dogs': 8}) Counter(['red', 'blue', 'red', 'green', 'blue', 'blue']) Counter({'red': 2, 'blue': 3, 'green': 1})
1.1 Kesan pada senarai/rentetan
Berikut ialah dua cara untuk menggunakannya, satu adalah menggunakannya secara langsung dan satu lagi adalah untuk instantiate it Jika anda ingin memanggilnya dengan kerap, jelas yang terakhir adalah lebih ringkas, kerana anda boleh dengan mudah memanggil pelbagai kaedah dalam Counter, dan rutin yang sama digunakan untuk urutan lelaran lain.
#首先引入该方法 from collections import Counter #对列表作用 list_01 = [1,9,9,5,0,8,0,9] #GNZ48-陈珂生日 print(Counter(list_01)) #Counter({9: 3, 0: 2, 1: 1, 5: 1, 8: 1}) #对字符串作用 temp = Counter('abcdeabcdabcaba') print(temp) #Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1}) #以上其实是两种使用方法,一种是直接用,一种是实例化以后使用,如果要频繁调用的话,显然后一种更简洁
1.2 Hasil keluaran
#查看类型 print( type(temp) ) #<class 'collections.Counter'> #转换为字典后输出 print( dict(temp) ) #{'b': 4, 'a': 5, 'c': 3, 'd': 2, 'e': 1} for num,count in enumerate(dict(temp).items()): print(count) """ ('e', 1) ('c', 3) ('a', 5) ('b', 4) ('d', 2) """
1.3 Gunakan kaedah item() terbina dalam untuk mengeluarkan
Jelas sekali kaedah ini lebih mudah daripada menukar kepada kamus dan kemudian mengeluarkannya :
print(temp.items()) #dict_items([('e', 1), ('c', 3), ('b', 4), ('d', 2), ('a', 5)]) for item in temp.items(): print(item) """ ('a', 5) ('c', 3) ('d', 2) ('e', 1) ('b', 4) """
Gunakan kaedah most_common() untuk mengembalikan senarai yang mengandungi n elemen paling biasa dan masa kejadiannya, dalam tertib menaik kesamaan Susun kepada rendah. Jika n diabaikan atau Tiada, most_common() akan mengembalikan semua elemen dalam pembilang Elemen dengan nilai kiraan yang sama diisih mengikut susunan penampilan pertama 3. kaedah elemen () dan sort()
#求序列中出现次数最多的元素 from collections import Counter list_01 = [1,9,9,5,0,8,0,9] temp = Counter(list_01) #统计出现次数最多的一个元素 print(temp.most_common(1)) #[(9, 3)] 元素“9”出现3次。 print(temp.most_common(2)) #[(9, 3), (0, 2)] 统计出现次数最多个两个元素 #没有指定个数,就列出全部 print(temp.most_common()) #[(9, 3), (0, 2), (1, 1), (5, 1), (8, 1)]
Counter('abracadabra').most_common(3) [('a', 5), ('b', 2), ('r', 2)] Counter('abracadabra').most_common(5) [('a', 5), ('b', 2), ('r', 2), ('c', 1), ('d', 1)]
c = Counter(a=4, b=2, c=0, d=-2) list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b'] sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b'] c = Counter(a=4, b=2, c=0, d=5) list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b', 'd', 'd', 'd', 'd', 'd']
4 operasi tolak tolak(): output tidak akan mengabaikan kiraan yang hasilnya sifar atau kurang daripada sifar
Tolak elemen daripada iterator atau objek peta Kedua-dua input dan output boleh menjadi 0 atau negatif.from collections import Counter c = Counter('ABCABCCC') print(c.elements()) #<itertools.chain object at 0x0000027D94126860> #尝试转换为list print(list(c.elements())) #['A', 'A', 'C', 'C', 'C', 'C', 'B', 'B'] #或者这种方式 print(sorted(c.elements())) #['A', 'A', 'B', 'B', 'C', 'C', 'C', 'C'] #这里与sorted的作用是: list all unique elements,列出所有唯一元素 #例如 print( sorted(c) ) #['A', 'B', 'C']
# Knuth's example for prime factors of 1836: 2**2 * 3**3 * 17**1 prime_factors = Counter({2: 2, 3: 3, 17: 1}) product = 1 for factor in prime_factors.elements(): # loop over factors product *= factor # and multiply them print(product) #1836 #1836 = 2*2*3*3*3*17
c = Counter(a=4, b=2, c=0, d=-2) d = Counter(a=1, b=2, c=3, d=4) c.subtract(d) c Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6}) #减去一个abcd str0 = Counter('aabbccdde') str0 Counter({'a': 2, 'b': 2, 'c': 2, 'd': 2, 'e': 1}) str0.subtract('abcd') str0 Counter({'a': 1, 'b': 1, 'c': 1, 'd': 1, 'e': 1}5 kaedah kamus Biasanya kaedah kamus boleh digunakan pada objek Counter, kecuali Terdapat dua kaedah yang berfungsi secara berbeza daripada kamus. fromkeys(iterable): Kaedah kelas ini tidak dilaksanakan dalam Kaunter.
subtract_test01 = Counter("AAB") subtract_test01.subtract("BCC") print(subtract_test01) #Counter({'A': 2, 'B': 0, 'C': -2})6 Operasi matematik
subtract_test02 = Counter("which") subtract_test02.subtract("witch") #从另一个迭代序列中减去元素 subtract_test02.subtract(Counter("watch")) #^…… #查看结果 print( subtract_test02["h"] ) # 0 ,whirch 中两个,减去witch中一个,减去watch中一个,剩0个 print( subtract_test02["w"] ) #-1
sum(c.values()) # total of all counts c.clear() # reset all counts list(c) # list unique elements set(c) # convert to a set dict(c) # convert to a regular dictionary c.items() # convert to a list of (elem, cnt) pairs Counter(dict(list_of_pairs)) # convert from a list of (elem, cnt) pairs c.most_common(n) # n least common elements +c # remove zero and negative counts
c = Counter(a=3, b=1) d = Counter(a=1, b=2) c + d # add two counters together: c[x] + d[x] Counter({'a': 4, 'b': 3}) c - d # subtract (keeping only positive counts) Counter({'a': 2}) c & d # intersection: min(c[x], d[x]) Counter({'a': 1, 'b': 1}) c | d # union: max(c[x], d[x]) Counter({'a': 3, 'b': 2})Penambahan dan penolakan unari (operator unari) bermaksud menambah atau menolak daripada pembilang kosong, yang bersamaan dengan mendarab nilai kiraan dengan nilai positif atau nilai negatif, output yang sama akan mengabaikan kiraan yang hasilnya sifar atau kurang daripada sifar:
print(Counter('AAB') + Counter('BCC')) #Counter({'B': 2, 'C': 2, 'A': 2}) print(Counter("AAB")-Counter("BCC")) #Counter({'A': 2})Tulis algoritma untuk mengira persamaan teks, persamaan wajaran:
print(Counter('AAB') & Counter('BBCC')) #Counter({'B': 1}) print(Counter('AAB') | Counter('BBCC')) #Counter({'A': 2, 'C': 2, 'B': 2})7 bilangan elemen, Kekunci() dan Nilai()
c = Counter(a=2, b=-4) +c Counter({'a': 2}) -c Counter({'b': 4})8 Pertanyaan hasil elemen tunggal
def str_sim(str_0,str_1,topn): topn = int(topn) collect0 = Counter(dict(Counter(str_0).most_common(topn))) collect1 = Counter(dict(Counter(str_1).most_common(topn))) jiao = collect0 & collect1 bing = collect0 | collect1 sim = float(sum(jiao.values()))/float(sum(bing.values())) return(sim) str_0 = '定位手机定位汽车定位GPS定位人定位位置查询' str_1 = '导航定位手机定位汽车定位GPS定位人定位位置查询' str_sim(str_0,str_1,5) 0.75
from collections import Counter c = Counter('ABCABCCC') print(sum(c.values())) # 8 total of all counts print(c.keys()) #dict_keys(['A', 'B', 'C']) print(c.values()) #dict_values([2, 2, 4])
from collections import Counter c = Counter('ABBCC') #查询具体某个元素的个数 print(c["A"]) #1
for elem in 'ADD': # update counts from an iterabl c[elem] += 1 print(c.most_common()) #[('C', 2), ('D', 2), ('A', 2), ('B', 2)] #可以看出“A”增加了一个,新增了两个“D”
del c["D"] print(c.most_common()) #[('C', 2), ('A', 2), ('B', 2)] del c["C"] print(c.most_common()) #[('A', 2), ('B', 2)]
elemen(): Mengembalikan lelaran, bilangan pengiraan berulang untuk setiap elemen, jika kiraan elemen itu kurang daripada 1 akan diabaikan ([iterable-or-mapping]): Tolak elemen daripada objek boleh lelar Input dan output boleh menjadi 0 atau nombor negatif, yang berbeza daripada peranan tanda tolak -
d = Counter("CCDD") c.update(d) print(c.most_common()) #[('B', 2), ('A', 2), ('C', 2), ('D', 2)]
Biasanya digunakan
Atas ialah kandungan terperinci Kaunter Python: Bagaimana untuk menggunakan collections.Counter?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!