>  기사  >  백엔드 개발  >  Pandas\' `concat` 함수의 \'levels\', \'keys\' 및 \'names\' 인수는 DataFrames에서 MultiIndex 구조를 생성하고 사용자 지정하는 데 어떻게 도움이 되나요?

Pandas\' `concat` 함수의 \'levels\', \'keys\' 및 \'names\' 인수는 DataFrames에서 MultiIndex 구조를 생성하고 사용자 지정하는 데 어떻게 도움이 되나요?

DDD
DDD원래의
2024-10-27 04:12:30178검색

How do the 'levels', 'keys', and 'names' arguments in Pandas' `concat` function help create and customize MultiIndex structures in DataFrames?

Pandas concat 함수의 '레벨', '키' 및 이름 인수는 무엇입니까?

소개

pandas.concat () 함수는 여러 Series 또는 DataFrame 개체를 단일 통합 DataFrame으로 결합하기 위한 다목적 도구입니다. 레벨, 키 및 이름 인수를 포함하여 연결 프로세스를 사용자 정의하기 위한 여러 인수를 제공합니다. 이 가이드에서는 이러한 인수에 대한 포괄적인 설명과 사용법을 보여주는 예제를 제공합니다.

concat() 함수 사용

pandas.concat() 함수의 구문은 다음과 같습니다.

<code class="python">pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)</code>

다음 코드 조각은 인덱스 축을 따라 두 개의 DataFrame을 연결하는 간단한 예를 보여줍니다.

<code class="python">import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

df = pd.concat([df1, df2])

print(df)</code>

출력:

   A  B
0  1  4
1  2  5
2  3  6
3  7  10
4  8  11
5  9  12

키 인수

key 인수를 사용하면 스칼라 값 또는 튜플 목록을 지정하여 결과 DataFrame에 MultiIndex 구조를 생성할 수 있습니다. 키 목록의 각 요소는 연결되는 개체 중 하나에 해당합니다.

예를 들어 다음 코드 조각을 고려하세요.

<code class="python">keys = ['df1', 'df2']
df = pd.concat([df1, df2], keys=keys)

print(df)</code>

출력:

    A  B
df1 0  1  4
    1  2  5
    2  3  6
df2 3  7  10
    4  8  11
    5  9  12

키 인수는 인덱스에 'keys'라는 새 수준을 만듭니다. 이를 통해 어떤 행이 어떤 DataFrame에 속하는지 쉽게 식별할 수 있습니다.

레벨 인수

레벨 인수는 사용할 MultiIndex의 특정 수준을 지정하는 데 사용됩니다. 이는 시퀀스 목록을 예상하며 각 시퀀스는 MultiIndex의 수준을 나타냅니다.

예를 들어 다음 코드는 MultiIndex가 두 가지 수준을 가져야 함을 지정합니다.

<code class="python">levels = [['df1', 'df2'], ['A', 'B']]
df = pd.concat([df1, df2], keys=keys, levels=levels)

print(df)</code>

출력:

    A  B
df1 A 0  1  4
   B 1  2  5
   C 2  3  6
df2 A 3  7  10
   B 4  8  11
   C 5  9  12

levels 인수는 더 복잡한 MultiIndex 구조를 생성하는 데 유연성을 제공합니다.

names 인수

names 인수를 사용하면 MultiIndex 수준에 대한 사용자 정의 이름을 지정할 수 있습니다. 각 문자열은 레벨의 이름을 나타내는 문자열 목록을 기대합니다.

<code class="python">names = ['DataFrame', 'Column']
df = pd.concat([df1, df2], keys=keys, levels=levels, names=names)

print(df)</code>

출력:

DataFrame Column  A  B
df1        A   0  1  4
            B   1  2  5
            C   2  3  6
df2        A   3  7  10
           B   4  8  11
           C   5  9  12

names 인수는 MultiIndex 구조를 처리할 때 컨텍스트를 제공하고 가독성을 높이는 데 도움이 됩니다. .

결론

레벨, 키, 이름 인수는 Pandas의 연결 프로세스를 사용자 정의하기 위한 강력한 도구입니다. 이를 통해 데이터 분석 및 조작을 용이하게 하는 유연하고 유익한 MultiIndex 구조를 만들 수 있습니다. 이러한 인수의 사용법을 이해하면 Pandas 프로그래밍 기술을 향상하고 데이터를 효과적으로 관리할 수 있습니다.

위 내용은 Pandas\' `concat` 함수의 \'levels\', \'keys\' 및 \'names\' 인수는 DataFrames에서 MultiIndex 구조를 생성하고 사용자 지정하는 데 어떻게 도움이 되나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.