>  기사  >  백엔드 개발  >  카운터를 사용하여 Python에서 단어 빈도를 계산하고 정렬하는 방법은 무엇입니까?

카운터를 사용하여 Python에서 단어 빈도를 계산하고 정렬하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-21 21:37:02605검색

How to Count and Sort Word Frequencies in Python Using Counter?

목록에서 단어 빈도 계산 및 정렬

최근 프로젝트에서 목록에서 단어의 발생 횟수를 계산하고 정렬해야 하는 문제에 직면했습니다. 빈도별로, 가장 자주 나타나는 단어가 목록의 시작 부분에 표시됩니다. 솔루션에 대한 기본 아이디어는 있었지만 Python 3.3에서 이를 효과적으로 구현하는 방법을 확신할 수 없었습니다.

다행히도 Python의 collections.Counter 클래스는 이 문제에 대한 간단하고 효율적인 솔루션을 제공합니다. 예는 다음과 같습니다.

<code class="python">from collections import Counter

# Create a list of words
list1 = ['apple', 'egg', 'apple', 'banana', 'egg', 'apple']

# Use Counter to count word occurrences
counts = Counter(list1)

# Print the counts
print(counts)  # Counter({'apple': 3, 'egg': 2, 'banana': 1})</code>

이 예에서 Counter는 키가 단어이고 값이 개수인 사전과 같은 개체를 만듭니다. print 문은 각 고유 단어의 개수를 출력합니다.

빈도를 기준으로 단어를 정렬하려면 Counter의 Most_common() 메서드를 사용할 수 있습니다. 이 메서드는 튜플 목록을 반환하며, 각 튜플에는 단어와 해당 개수가 포함됩니다. 기본적으로 목록은 빈도의 내림차순으로 정렬됩니다. 즉, 가장 자주 사용되는 단어가 처음에 오게 됩니다.

단어 목록을 정렬하는 방법은 다음과 같습니다.

<code class="python"># Sort the words based on frequency
sorted_words = [word for word, count in sorted(counts.most_common(), key=lambda x: x[1], reverse=True)]

# Print the sorted list
print(sorted_words)  # ['apple', 'egg', 'banana']</code>

In 이 코드 sorted는 reverse=True 인수를 사용하여 두 번째 요소(개수)를 기준으로 튜플 목록을 내림차순으로 정렬합니다. 이렇게 하면 가장 자주 사용되는 단어가 sorted_words 목록에서 먼저 표시됩니다.

위 내용은 카운터를 사용하여 Python에서 단어 빈도를 계산하고 정렬하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.