1. 요구 사항
일련의 사전이나 개체 인스턴스가 있으며 특정 필드에 따라 데이터를 그룹화하고 반복하려고 합니다.
2. 솔루션
itertools.groupby() 함수는 데이터를 그룹화할 때 특히 유용합니다.
예:
from operator import itemgetter from itertools import groupby rows=[ {'name':'mark','age':18,'uid':'110'}, {'name':'miaomiao','age':28,'uid':'160'}, {'name':'miaomiao2','age':28,'uid':'150'}, {'name':'xiaohei','age':38,'uid':'130'}, ] #首先根据age排序 rows.sort(key=itemgetter('age')) for age,items in groupby(rows,key=itemgetter('age')): print(age) for i in items: print(i)
결과:
18 {'name': 'mark', 'age': 18, 'uid': '110'} 28 {'name': 'miaomiao', 'age': 28, 'uid': '160'} {'name': 'miaomiao2', 'age': 28, 'uid': '150'} 38 {'name': 'xiaohei', 'age': 38, 'uid': '130'}
3.
Python의 단일 키 다중 값 사전 구현 방법 분석
함수 groupby()는 시퀀스를 스캔하여(또는 매개변수 키는 지정된 함수에서 반환된 값)을 그룹화합니다. groupby()는 반복자를 생성하고 각 반복은 값과 sub_iterator를 반환합니다. 이 반복자는 그룹에서 해당 값을 가진 모든 항목을 생성할 수 있습니다.
여기서 중요한 것은 먼저 연령을 기준으로 데이터를 정렬하는 것입니다. groupby()는 정렬되지 않기 때문입니다.
무작위 액세스를 허용하기 위해 단순히 날짜를 기준으로 데이터를 대규모 데이터 구조로 그룹화하는 경우 defaultdict()를 사용하여 단일 키 다중 값 사전을 구축하는 것이 더 나을 수 있습니다.
from collections import defaultdict rows=[ {'name':'mark','age':18,'uid':'110'}, {'name':'miaomiao','age':28,'uid':'160'}, {'name':'miaomiao2','age':28,'uid':'150'}, {'name':'xiaohei','age':38,'uid':'130'}, ] rows_by_age=defaultdict(list) for row in rows: rows_by_age[row['age']].append(row) for a in rows_by_age[28]: print(a)
결과:
{'name': 'miaomiao', 'age': 28, 'uid': '160'} {'name': 'miaomiao2', 'age': 28, 'uid': '150'}
정렬을 고려하지 않는 경우 일반적으로 defaultdict 방법이 groupby보다 빠릅니다.
위 내용은 Python이 itertools.groupby()를 사용하여 필드에 따라 레코드를 그룹화하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!