Maison  >  Article  >  développement back-end  >  python compte les occurrences de mots

python compte les occurrences de mots

angryTom
angryTomoriginal
2020-02-13 11:09:129943parcourir

python compte les occurrences de mots

Python compte le nombre d'occurrences de mots

Pour faire des statistiques de fréquence de mots, utiliser le dictionnaire est sans aucun doute le plus approprié Type de données. Le mot est utilisé comme clé du dictionnaire et le nombre de fois où le mot apparaît est utilisé comme valeur du dictionnaire. Il est très pratique d'enregistrer la fréquence de chaque mot. Le dictionnaire ressemble beaucoup à notre téléphone. livre, et chaque nom est associé à un numéro de téléphone.

Ce qui suit est le code d'implémentation spécifique, qui lit les mots du fichier importthis.txt et compte les 5 mots avec le plus d'occurrences.

# -*- coding:utf-8 -*-
import io
import re

class Counter:
    def __init__(self, path):
        """
        :param path: 文件路径
        """
        self.mapping = dict()
        with io.open(path, encoding="utf-8") as f:
            data = f.read()
            words = [s.lower() for s in re.findall("\w+", data)]
            for word in words:
                self.mapping[word] = self.mapping.get(word, 0) + 1

    def most_common(self, n):
        assert n > 0, "n should be large than 0"
        return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]

if __name__ == '__main__':
    most_common_5 = Counter("importthis.txt").most_common(5)
    for item in most_common_5:
        print(item)

Effet d'exécution :

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

Plus de tutoriels Python, apprentissage recommandé : Tutoriel vidéo Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn