首頁 >後端開發 >Python教學 >如何在 Python 中為多個 DataFrame 建立叢集堆積長條圖?

如何在 Python 中為多個 DataFrame 建立叢集堆積長條圖?

Susan Sarandon
Susan Sarandon原創
2024-11-02 19:07:30383瀏覽

How to Create Clustered Stacked Bar Charts for Multiple DataFrames in Python?

為多個DataFrame 建立集群堆疊條形圖

問題陳述

處理具有相同列和索引的多個資料幀時,可能需要建立集群堆積條形圖以視覺化資料。當您想要分別堆疊每個資料幀的長條圖並按對應的索引分組時,就會出現挑戰。

使用 Pandas 和 Matplotlib 的解決方案

結合使用 Pandas 和 Matplotlib,我們可以實現這一目標透過手動調整條形矩形的位置和陰影圖案。以下是詳細的解決方案:

<code class="python">import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

def plot_clustered_stacked(dfall, labels=None, title="multiple stacked bar plot",  H="/" , **kwargs):

    n_df = len(dfall)
    n_col = len(dfall[0].columns)
    n_ind = len(dfall[0].index)
    axe = plt.subplot(111)

    for df in dfall:  # for each data frame
        axe = df.plot(kind="bar",
                      linewidth=0,
                      stacked=True,
                      ax=axe,
                      legend=False,
                      grid=False,
                      **kwargs)  # make bar plots

    h, l = axe.get_legend_handles_labels() # get the handles we want to modify
    for i in range(0, n_df * n_col, n_col): # len(h) = n_col * n_df
        for j, pa in enumerate(h[i:i+n_col]):
            for rect in pa.patches: # for each index
                rect.set_x(rect.get_x() + 1 / float(n_df + 1) * i / float(n_col))
                rect.set_hatch(H * int(i / n_col)) #edited part
                rect.set_width(1 / float(n_df + 1))

    axe.set_xticks((np.arange(0, 2 * n_ind, 2) + 1 / float(n_df + 1)) / 2.)
    axe.set_xticklabels(df.index, rotation = 0)
    axe.set_title(title)

    # Add invisible data to add another legend
    n=[]
    for i in range(n_df):
        n.append(axe.bar(0, 0, color="gray", hatch=H * i))

    l1 = axe.legend(h[:n_col], l[:n_col], loc=[1.01, 0.5])
    if labels is not None:
        l2 = plt.legend(n, labels, loc=[1.01, 0.1])
    axe.add_artist(l1)
    return axe</code>

Seaborn 解決方案

使用Seaborn 的barplot 函數,我們可以建立堆疊長條圖,但無法原生堆疊不同資料幀的條形圖。為了克服這個問題,我們可以使用以下解決方法:

  1. 使用 pd.melt() 將資料幀轉換為「整齊」的格式。
  2. 使用下列指令計算每個條形的累積總和groupby 和 cumsum(),建立一個名為 vcs 的新欄位。
  3. 迭代變數組並使用繪製累積和sns.barplot().
<code class="python">import seaborn as sns

# Convert dataframes to tidy format
dfall.set_index([&quot;Name&quot;, &quot;index&quot;, &quot;variable&quot;], inplace=1)
dfall[&quot;vcs&quot;] = dfall.groupby(level=[&quot;Name&quot;, &quot;index&quot;]).cumsum()
dfall.reset_index(inplace=True)

# Create color palette
c = [&quot;blue&quot;, &quot;purple&quot;, &quot;red&quot;, &quot;green&quot;, &quot;pink&quot;]

# Iterate through groups and plot stacked bars
for i, g in enumerate(dfall.groupby(&quot;variable&quot;)):
    ax = sns.barplot(data=g[1],
                    x=&quot;index&quot;,
                    y=&quot;vcs&quot;,</code>

以上是如何在 Python 中為多個 DataFrame 建立叢集堆積長條圖?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn