Heim  >  Artikel  >  Backend-Entwicklung  >  Python zählt Wortvorkommen

Python zählt Wortvorkommen

angryTom
angryTomOriginal
2020-02-13 11:09:129943Durchsuche

Python zählt Wortvorkommen

Python zählt die Anzahl der Wortvorkommen

Um Worthäufigkeitsstatistiken zu erstellen, ist die Verwendung von Wörterbuch zweifellos am besten geeignet Der Datentyp wird als Schlüssel des Wörterbuchs verwendet, und die Häufigkeit, mit der das Wort erscheint, wird als Wert des Wörterbuchs verwendet. Es ist sehr praktisch, die Häufigkeit jedes Worts aufzuzeichnen Buch, und jedem Namen ist eine Telefonnummer zugeordnet.

Das Folgende ist der spezifische Implementierungscode, der Wörter aus der Datei importthis.txt liest und die 5 Wörter zählt, die am häufigsten vorkommen.

# -*- coding:utf-8 -*-
import io
import re

class Counter:
    def __init__(self, path):
        """
        :param path: 文件路径
        """
        self.mapping = dict()
        with io.open(path, encoding="utf-8") as f:
            data = f.read()
            words = [s.lower() for s in re.findall("\w+", data)]
            for word in words:
                self.mapping[word] = self.mapping.get(word, 0) + 1

    def most_common(self, n):
        assert n > 0, "n should be large than 0"
        return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]

if __name__ == '__main__':
    most_common_5 = Counter("importthis.txt").most_common(5)
    for item in most_common_5:
        print(item)

Ausführungseffekt:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

Weitere Python-Tutorials, empfohlenes Lernen: Python-Video-Tutorial

Das obige ist der detaillierte Inhalt vonPython zählt Wortvorkommen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn