배열 길이가 다양한 사전에서 DataFrame 생성
값이 numpy 배열인 사전에서 DataFrame을 생성하면 후속 오류가 발생할 수 있습니다. 배열의 길이가 같지 않은 경우. 이는 Pandas가 각 열에 대해 일관된 배열 길이를 요구하기 때문입니다.
이를 극복하기 위해 Pandas는 누락된 값(NaN)을 사용하여 더 짧은 배열을 채울 수 있습니다. 이를 통해 길이가 다른 열로 DataFrame을 생성할 수 있습니다.
Python 2.x:
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.iteritems() ]))
Python 3.x:
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.items() ]))
두 경우 모두 결과 DataFrame에는 A와 B 열이 있습니다. 여기서 A는 사전에 있는 각 배열의 처음 두 값을 포함하고 B는 네 개의 값을 모두 포함합니다. 더 짧은 배열(A)은 누락된 값에 대해 NaN으로 채워집니다.
출력:
A B 0 1 1 1 2 2 2 NaN 3 3 NaN 4
위 내용은 다양한 배열 길이를 사용하여 사전에서 Pandas DataFrame을 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!