Pandas 데이터 프레임 열에서 튜플을 추출하는 방법
문제:
Pandas 데이터 프레임에서 , 튜플을 포함하는 열을 갖는 것이 일반적입니다. 그러나 이러한 튜플을 사용하여 작업하는 것은 번거로울 수 있습니다. 분석을 용이하게 하려면 이러한 열을 개별 튜플 요소를 포함하는 여러 열로 분할하는 것이 바람직한 경우가 많습니다.
해결책:
튜플 열을 별도의 열로 변환하려면 , 다음 단계를 따르세요.
tolist() 메서드를 사용하여 열을 튜플 목록으로 변환합니다.
<code class="python">column_list = column.tolist()</code>
새 항목 만들기 튜플 목록의 데이터 프레임:
<code class="python">new_df = pd.DataFrame(column_list, index=dataframe.index)</code>
새 데이터 프레임을 원래 데이터 프레임에 새 열로 할당:
<code class="python">dataframe[['column_a', 'column_b']] = new_df[['0', '1']]</code>
예:
다음 데이터 프레임을 고려하세요.
<code class="python">>>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ 0 (4.2907610988480362, 12.416745648065584) 1 (4.18864306788194, 12.980833914392477) RF \ 0 (9.9484841581029428, 16.46902345373697) 1 (10.139848213735391, 16.282141345406522) GB \ 0 (0.012816232716538605, 15.950164822266007) 1 (0.012814519804493328, 15.305745202851712) ET DATA 0 (0.00034337162272515505, 16.284800366214057) j2m 1 (0.00024811554516431878, 15.556506191784194) j2m >>></code>
LCV 열을 개별 열 LCV-a 및 LCV-b로 분할하려면 다음 코드를 사용할 수 있습니다.
<code class="python">df[['LCV-a', 'LCV-b']] = pd.DataFrame(df['LCV'].tolist(), index=df.index)</code>
결과 데이터 프레임은 다음과 같습니다.
<code class="python">>>> df y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV-a LCV-b \ 0 19.365430594452338 13.880062435173587 1 19.099614489458364 14.018867136617146 RIDGE CV \ 0 (4.2907610988480362, 12.416745648065584) 1 (4.18864306788194, 12.980833914392477) RF \ 0 (9.9484841581029428, 16.46902345373697) 1 (10.139848213735391, 16.282141345406522) GB \ 0 (0.012816232716538605, 15.950164822266007) 1 (0.012814519804493328, 15.305745202851712) ET DATA 0 (0.00034337162272515505, 16.284800366214057) j2m 1 (0.00024811554516431878, 15.556506191784194) j2m</code>
위 내용은 Pandas 데이터 프레임에서 튜플 열을 별도의 열로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!