合併在For 循環中產生的DataFrame
使用多個資料來源時,通常需要將資料組合到單一合併的資料框中。此問題說明了嘗試使用 pd.concat 函數附加 for 迴圈中產生的資料幀時面臨的常見問題。
問題中提出的初始方法由於錯誤呼叫 pd.append 而面臨錯誤。函數至少需要兩個參數,第一個參數是要附加的資料幀,第二個參數應該是要附加的資料。程式碼嘗試將資料追加到自身,這是無效的。
追加資料幀的正確方法是將它們儲存在清單中,然後使用 pd.concat 將它們合併到單一資料幀中。這是一個改進的解決方案:
<code class="python">appended_data = [] for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data.append(data) # concatenate the list of dataframes appended_data = pd.concat(appended_data) # save the merged dataframe to an excel file appended_data.to_excel('appended.xlsx')</code>
此程式碼匯入必要的庫,迭代 Excel 文件,從每個文件讀取資料並將資料幀儲存在列表中。最後,它使用 pd.concat 連接資料幀列表並將合併的資料幀匯出到新的 Excel 檔案。這種方法允許無縫附加循環中生成的資料幀。
以上是如何使用 pd.concat 合併在 For 迴圈中產生的 DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!