在 Pandas 中處理具有不等長度數組的字典需要量身定制的方法。當嘗試建立一個DataFrame,其中每一列代表字典中的一個陣列時,可能會遇到ValueError:「陣列必須具有相同的長度。」
來規避此問題問題,我們利用Pandas 的Series 對象,它可以保存不同長度的陣列。透過將每個字典值轉換為 Series,我們可以有效地儲存數組,而不管數組的長度如何。以下程式碼片段示範了這種方法:
處理不同長度的陣列時,通常會遇到缺失值,即較短的陣列無法填充剩餘的單元格。預設情況下,Pandas 使用 NaN(非數字)值填入這些空白。此行為保留原始數據,同時提供一致的分析結構。
如果需要,您可以使用 DataFrame 中的 Missing_values 參數自訂缺失值的處理( ) 建構子。例如,若要以零取代NaN 取代缺失值,您可以指定missing_values=0,如下所示:
以下輸出說明了使用該方法建立的DataFrame如上所述:
如您所觀察到的,較短的陣列會在對應的單元格中產生NaN 值,從而提供數據的全面表示,同時保持所需的表格格式。
以上是如何從數組長度不均勻的字典建構 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!