>  기사  >  백엔드 개발  >  Python에서 단어 빈도를 계산하고 빈도별로 정렬하는 방법은 무엇입니까?

Python에서 단어 빈도를 계산하고 빈도별로 정렬하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-10-21 21:39:03830검색

How to Count Word Frequency and Sort by Frequency in Python?

단어 빈도 계산 및 빈도별 정렬

텍스트 데이터가 포함된 대규모 데이터 세트로 작업할 때 개별 단어의 빈도를 분석해야 하는 경우가 많습니다. . 이 정보는 다양한 자연어 처리(NLP) 작업에 사용될 수 있습니다. Python에서는 Counter라는 강력한 도구를 사용하여 이 작업을 단순화할 수 있습니다.

디자인 구현

디자인에서는 다음 단계를 간략하게 설명합니다.

  1. 고유 단어(newlst)를 저장하려면 빈 목록을 만듭니다.
  2. 해당 단어 빈도(빈도)를 저장하려면 빈 목록을 만듭니다.
  3. 원래 단어 목록을 반복합니다.
  4. 각 단어에 대해 이미 newlst에 있는지 확인합니다.
  5. newlst에 해당 단어가 없으면 추가하고 빈도를 1로 설정합니다.
  6. 해당 단어가 이미 newlst에 있는 경우 , 빈도를 증가시킵니다.
  7. 빈도 목록을 기준으로 newlst를 정렬합니다.

Python에서 카운터 사용

Python의 컬렉션 모듈은 특수한 컬렉션 기능을 제공합니다. Counter라는 클래스는 iterable의 요소를 계산하고 집계하도록 설계되었습니다. 카운터를 사용하면 한 줄의 코드로 3~6단계를 수행할 수 있습니다. Counter를 사용하여 디자인을 구현하는 방법은 다음과 같습니다.

<code class="python">from collections import Counter

# Create a Counter from the list of words
counts = Counter(original_list)

# Sort the keys (unique words) based on their frequencies
sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True)</code>

이 코드는 고유 단어의 정렬된 목록을 생성하며, 여기서 빈도가 가장 높은 단어가 먼저 나타납니다.

<code class="python">list1 = ['the', 'car', 'apple', 'banana', 'car', 'apple']
counts = Counter(list1)
print(counts)  # Counter({'apple': 2, 'car': 2, 'banana': 1, 'the': 1})
sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True)
print(sorted_words)  # ['apple', 'car', 'banana', 'the']</code>

위 내용은 Python에서 단어 빈도를 계산하고 빈도별로 정렬하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.