파이썬으로 대형 제품 데이터 세트를 효율적으로 처리하고 정렬하십시오
이 기사에서는 제품 정보가 포함 된 목록을 제품 통계를 포함하는 다른 목록으로 효율적으로 변환하고 특정 규칙별로 정렬하는 방법을 보여줍니다. 원래 데이터에는 제품 제목, 색상, 크기 및 수량이 포함되어 있습니다. 목표는 동일한 제목, 색상 및 크기의 항목 수를 계산하고 각 제목의 모든 항목의 총 수량을 계산하는 것입니다. 최종 결과는 총 수량의 하강 순서로 배열됩니다.
원시 데이터 예 :
데이터 = [ ( '드레스', '화이트', 's', 1), ( '드레스', '화이트', 's', 1), ( '드레스', '검은 색', 'm', 1), ( '바지', '화이트', 's', 1), ]]
대상 출력 형식 :
결과 = [ ( '드레스', '화이트', 's', 2, 3), ( '드레스', '검은 색', 'm', 1, 3), ( '바지', '흰색', 's', 1, 1), ]]
여기서 마지막 숫자는이 제목의 모든 항목의 총 수를 나타냅니다. 대형 데이터 세트를 효율적으로 처리하려면 COLLESS의 collections.Counter
개체를 사용합니다.
다음 코드는이 기능을 구현합니다.
컬렉션 가져 오기 카운터 데이터 = [ ( '드레스', '화이트', 's', 1), ( '드레스', '화이트', 's', 1), ( '드레스', '검은 색', 'm', 1), ( '바지', '화이트', 's', 1), ]] # 카운터를 사용하여 각 (제목, 색상, 크기) 콤비네이션 item_counts = 카운터 (데이터의 항목에 대한 튜플 (항목 [: -1])의 수를 계산합니다. # 카운터를 사용하여 각 타이틀의 총 수를 계산하십시오. title_totals = 카운터 (데이터의 항목에 대한 항목 [0]). # 제목, 색상, 크기, 수량 및 총 타이틀 수로 결과 목록 작성 결과 = [ (*항목, 카운트, title_totals [항목 [0]]) 항목의 경우 item_counts.Items ()의 계산 ]] # 총 타이틀 수를 내림차순으로 정렬 한 다음 제목, 색상 및 크기 오름차순 순서로 정렬합니다 (key = lambda x : (-x [4], x [0], x [1], x [2]). 인쇄 (결과)
이 코드는 먼저 Counter
사용하여 각 제품 조합 및 각 제목의 발생 수를 효율적으로 계산합니다. 그런 다음 필요한 모든 정보가 포함 된 새 목록을 구성하고 총 번호로 정렬합니다. 이 접근법은 Counter
의 효율성을 최대한 활용하고 수천 개 이상의 레코드를 포함하는 대형 데이터 세트를 쉽게 처리 할 수 있습니다.
위 내용은 파이썬에서 대형 제품 데이터 세트를 효율적으로 계산하고 정렬하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Pythonusesahybridmodelofilationandlostretation : 1) ThePyThoninterPretreCeterCompileSsourcodeIntOplatform-IndependentBecode.

Pythonisbothingretedandcompiled.1) 1) it 'scompiledtobytecodeforportabilityacrossplatforms.2) thebytecodeisthentenningreted, withfordiNamictyTeNgreted, WhithItmayBowerShiledlanguges.

forloopsareusedwhendumberofitessiskNowninadvance, whilewhiloopsareusedwhentheationsdepernationsorarrays.2) whiloopsureatableforscenarioScontiLaspecOndCond

pythonisnotpurelynlogreted; itusesahybrideprophorfbyodecodecompilationandruntime -INGRETATION.1) pythoncompilessourcecodeintobytecode, thepythonVirtualMachine (pvm)

ToconcatenatelistsinpythonwithesameElements, 사용 : 1) OperatorTokeEpduplicates, 2) asettoremovedUplicates, or3) listComperensionForControlOverDuplicates, 각 methodHasDifferentPerferformanCeanDorderImpestications.

PythonisancerpretedLanguage, 비판적 요소를 제시하는 PytherfaceLockelimitationsIncriticalApplications.1) 해석 된 언어와 같은 thePeedBackandbackandrapidProtoTyping.2) CompilledlanguagesLikec/C transformt 해석

useforloopswhhenmerfiterationsiskNownInAdvance 및 WhileLoopSweHeniTesslationsDepoyConditionismet whilEroopsSuitsCenarioswhereTheLoopScenarioswhereTheLoopScenarioswhereTheLoopScenarioswhereTherInatismet, 유용한 광고 인 푸트 gorit


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.