>  기사  >  백엔드 개발  >  Python에서 키별로 데이터를 그룹화하고 결과를 특정 형식으로 반환하여 반복 키를 사용하여 데이터를 효과적으로 처리하고 순서를 유지하려면 어떻게 해야 합니까?

Python에서 키별로 데이터를 그룹화하고 결과를 특정 형식으로 반환하여 반복 키를 사용하여 데이터를 효과적으로 처리하고 순서를 유지하려면 어떻게 해야 합니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-28 14:08:30847검색

How can I group data by keys in Python and return the result in a specific format, effectively handling data with repeating keys and maintaining order?

Python의 키별 데이터 그룹화

이 가이드에서는 Python에서 특정 키별로 데이터를 그룹화하는 작업을 다룹니다. 우리는 주어진 데이터 세트에 대해 효율적이고 정렬된 그룹화 솔루션을 달성하는 것을 목표로 합니다.

문제 설명

키-값 쌍으로 표시되는 다음 데이터 세트를 고려하십시오.

<code class="python">input = [
          ('11013331', 'KAT'), 
          ('9085267',  'NOT'), 
          ('5238761',  'ETH'), 
          ('5349618',  'ETH'), 
          ('11788544', 'NOT'), 
          ('962142',   'ETH'), 
          ('7795297',  'ETH'), 
          ('7341464',  'ETH'), 
          ('9843236',  'KAT'), 
          ('5594916',  'ETH'), 
          ('1550003',  'ETH')
        ]</code>

목표는 이러한 데이터 쌍을 해당 키(각 튜플의 두 번째 요소)로 그룹화하고 그룹화된 결과를 다음 형식으로 반환하는 것입니다.

<code class="python">result = [ 
           { 
             'type': 'KAT', 
             'items': ['11013331', '9843236'] 
           },
           {
             'type': 'NOT', 
             'items': ['9085267', '11788544'] 
           },
           {
             'type': 'ETH', 
             'items': ['5238761', '962142', '7795297', '7341464', '5594916', '1550003'] 
           }
         ] </code>

해결책

다음은 데이터를 효율적으로 그룹화하는 단계입니다.

  1. 사전 만들기: defaultdict를 사용하여 각 키에 대한 항목을 저장합니다. 각각의 새 키에 대해 빈 목록을 생성하는 기본 팩토리로 사전을 초기화합니다.

    <code class="python">from collections import defaultdict
    
    res = defaultdict(list)
    for v, k in input:
     res[k].append(v)</code>
  2. 사전을 예상 형식으로 변환합니다. 최종 결과적으로 사전을 원하는 구조의 사전 목록으로 변환합니다.

    <code class="python">result = [{'type': k, 'items': v} for k, v in res.items()]</code>

선택 사항:

  • Python 3.7에서는 사전이 삽입 순서를 유지하지 않았습니다. 키의 원래 순서를 유지하려면 OrderedDict를 대신 사용하는 것이 좋습니다.
  • 또는 그룹화에 itertools.groupby 함수를 사용할 수도 있지만 입력을 미리 정렬해야 합니다.
  • 대규모 데이터세트의 경우 그룹화 기능이 있는 데이터베이스를 사용하는 것이 여기에 제시된 인메모리 솔루션보다 더 효율적일 수 있습니다.

위 내용은 Python에서 키별로 데이터를 그룹화하고 결과를 특정 형식으로 반환하여 반복 키를 사용하여 데이터를 효과적으로 처리하고 순서를 유지하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.