首頁  >  文章  >  後端開發  >  python統計序列中元素的方法

python統計序列中元素的方法

小云云
小云云原創
2018-03-29 13:55:401628瀏覽

本文主要為大家詳細介紹了python如何統計序列中的元素,具有一定的參考價值,有興趣的小夥伴們可以參考一下,希望能幫助到大家。

問題1:

       隨機數列[12,5,8,7,8,9,4,8​​,5,...] 中出現次數最高的3個元素​​,他們出現的次數

問題2:

       對某英文文章的單詞,進行詞頻統計,找出出現次數最搞得10個單詞,他們出現的次數是多少?

上面問題都是以字典的形式保存結果

如何解決問題1?

方法1:

#!/usr/bin/python3
 
from random import randint
 
 
def count_seq(data):
   
  # 初始化统计结果字典,data中的key作为结果字典的key,0作为每个key的初始值
  result_c = dict.fromkeys(data, 0)
   
  # 循环data,对字典中中碰到的值进行 +1 ,循环完成后就是结果
  for x in data:
    result_c[x] += 1
  return result_c
 
if __name__ == '__main__':
  # 生成20个随机数
  data = [randint(0, 20) for _ in range(20)]
  print(data)
   
  # 结果
  result_c = count_seq(data)
  for i in result_c:
    print(i, result_c[i])

方法2:

#使用collections下Counter物件

#!/usr/bin/python3
 
from random import randint
from collections import Counter
 
 
def count_seq(data):
   
  # 创建Counter对象,并把打他传递进去
  median_c = Counter(data)
   
  # 返回统计最大的3个数
  return median_c.most_common(3)
 
if __name__ == '__main__':
  # 生成20个随机数
  data = [randint(0, 20) for _ in range(20)]
  print(data)
   
  # 结果
  result_c = count_seq(data)
  print(result_c, dict(result_c))

問題2如何解決?

import re
from collections import Counter
 
 
def count_words():
  # 读取文件
  with open('english_article', 'r', encoding='utf-8') as data:
    print()
    # 文件单词分割
    data_list = re.split('\W+', data.read())
  # 单词统计
  words = Counter(data_list)
  # 取单词统计最大的10个值
  return words.most_common(10)
 
if __name__ == '__main__':
  result = count_words()
  print(result)

以上是python統計序列中元素的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn