NumPy에서 특정 열을 기준으로 데이터를 그룹화할 수 있나요?
소개:
데이터 그룹화는 많은 데이터 분석 시나리오에서 중요한 작업입니다. Python의 강력한 수치 라이브러리인 NumPy는 배열을 조작하는 다양한 기능을 제공하지만 전용 그룹화 기능이 부족합니다. 이 기사에서는 전용 함수를 명시적으로 사용하지 않고 NumPy에서 그룹화를 수행하는 방법을 보여줍니다.
질문:
NumPy에 배열을 그룹화하는 함수가 있나요? 제공된 배열에 표시된 첫 번째 열?
array([[ 1, 275], [ 1, 441], [ 1, 494], [ 1, 593], [ 2, 679], [ 2, 533], [ 2, 686], [ 3, 559], [ 3, 219], [ 3, 455], [ 4, 605], [ 4, 468], [ 4, 692], [ 4, 613]])
예상됨 출력:
array([[[275, 441, 494, 593]], [[679, 533, 686]], [[559, 219, 455]], [[605, 468, 692, 613]]], dtype=object)
답변:
NumPy는 "그룹화 기준" 기능을 명시적으로 제공하지 않지만 Eelco Hoogendoorn의에서 영감을 받은 대체 접근 방식을 제공합니다. 도서관. 이 접근 방식은 배열의 첫 번째 열이 항상 증가한다는 가정을 기반으로 합니다. 그렇지 않은 경우 다음을 사용하여 첫 번째 열을 기준으로 배열을 정렬해야 합니다.
a = a[a[:, 0].argsort()]
첫 번째 열 값이 증가한다는 가정을 사용하여 다음 코드는 그룹화 작업을 수행합니다.
np.split(a[:, 1], np.unique(a[:, 0], return_index=True)[1][1:])
이 코드는 첫 번째 열의 고유 값을 기반으로 배열 요소를 하위 배열로 효과적으로 그룹화합니다. 각 하위 배열은 첫 번째 열 값이 동일한 모든 요소에 대한 두 번째 열 값을 포함하는 그룹을 나타냅니다.
추가 고려 사항:
- 이 방법의 복잡성은 O입니다. (n log(n)).
- 결과 목록은 NumPy 배열이므로 후속 NumPy 작업에는 변환 작업이 필요합니다.
- 성능 비교: 이 방법은 더 작은 데이터 세트의 경우 Pandas 및 defaultdict를 포함한 다른 그룹화 접근 방식보다 더 빠른 것으로 경험적으로 나타났습니다.
따라서 NumPy는 배열 조작 및 정렬 기능을 활용하여 데이터를 그룹화하는 유연하고 효율적인 방법을 제공합니다. 전용 그룹화 기능이 없어도 말이죠.
위 내용은 NumPy는 열의 고유 값을 기반으로 데이터를 효율적으로 그룹화할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

slicepaythonlistisdoneusingthesyntaxlist [start : step : step] .here'showitworks : 1) startistheindexofthefirstelementtoinclude.2) stopistheindexofthefirstelemement.3) stepisincrementbetwetweentractionsoftortionsoflists

NumpyAllowsForVariousOperationsOnArrays : 1) BasicArithmeticLikeadDition, Subtraction, A 및 Division; 2) AdvancedOperationsSuchasmatrixmultiplication; 3) extrayintondsfordatamanipulation; 5) Ag

Arraysinpython, 특히 Stroughnumpyandpandas, areestentialfordataanalysis, setingspeedandefficiency

ListSandnumpyArraysInpythonHavedifferentmoryfootPrints : ListSaremoreFlexibleButlessMemory-Efficer, whilumpyArraySareOptimizedFornumericalData.1) ListSTorERENFERENCESTOOBJECTS, OverHeadAround64ByTeson64-BitSyStems.2) NumpyArraysTATACONTACOTIGUOU

ToensurePythonScriptTscriptsBecorrectelyRossDevelopment, Staging and Production, UsethesEStrategies : 1) EnvironmberVariblesForsimplesettings, 2) ConfigurationFilesforcomplexSetups 및 3) DynamicLoadingForAdAptability

Python List 슬라이싱의 기본 구문은 목록 [start : stop : step]입니다. 1. Start는 첫 번째 요소 인덱스, 2.Stop은 첫 번째 요소 인덱스가 제외되고 3. Step은 요소 사이의 단계 크기를 결정합니다. 슬라이스는 데이터를 추출하는 데 사용될뿐만 아니라 목록을 수정하고 반전시키는 데 사용됩니다.

ListSoutPerformArraysin : 1) DynamicsizingandFrequentInsertions/Deletions, 2) StoringHeterogeneousData 및 3) MemoryEfficiencyForsParsEdata, butMayHavesLightPerformanceCosceperationOperations.

TOCONVERTAPYTHONARRAYTOALIST, USETHELIST () CONSTUCTORORAGENERATERATOREXPRESSION.1) importTheArrayModuleAndCreateAnarray.2) USELIST (ARR) 또는 [XFORXINARR] TOCONVERTITTOALIST.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는
