Maison  >  Article  >  développement back-end  >  Comment créer des graphiques à barres empilées en cluster en Python avec Pandas et Matplotlib ?

Comment créer des graphiques à barres empilées en cluster en Python avec Pandas et Matplotlib ?

Linda Hamilton
Linda Hamiltonoriginal
2024-11-02 12:46:30279parcourir

How to Create Clustered Stacked Bar Plots in Python with Pandas and Matplotlib?

Création de graphiques à barres empilées en cluster

Problème :

Vous disposez de plusieurs blocs de données avec des colonnes et un index identiques et souhaitez créez un graphique à barres empilées avec les données de chaque bloc de données regroupées.

Solution utilisant Pandas et Matplotlib :

  1. Combinez les blocs de données en un seul bloc de données .
  2. Utilisez la fonction plot_clustered_stacked() pour créer le tracé à barres empilées. Cette fonction prend les arguments suivants :

    • dfall : une liste de blocs de données à tracer.
    • labels : une liste de noms pour les blocs de données (facultatif).
    • titre : le titre du tracé (facultatif).
    • H : le motif de hachures à utiliser pour chaque bloc de données (facultatif).

Code :

<code class="python">import pandas as pd
import matplotlib.cm as cm
import numpy as np
import matplotlib.pyplot as plt

def plot_clustered_stacked(dfall, labels=None, title=&quot;multiple stacked bar plot&quot;,  H=&quot;/&quot;, **kwargs):
    n_df = len(dfall)
    n_col = len(dfall[0].columns)
    n_ind = len(dfall[0].index)
    axe = plt.subplot(111)

    for df in dfall : # for each data frame
        axe = df.plot(kind=&quot;bar&quot;,
                      linewidth=0,
                      stacked=True,
                      ax=axe,
                      legend=False,
                      grid=False,
                      **kwargs)  # make bar plots

    h,l = axe.get_legend_handles_labels() # get the handles we want to modify
    for i in range(0, n_df * n_col, n_col): # len(h) = n_col * n_df
        for j, pa in enumerate(h[i:i+n_col]):
            for rect in pa.patches: # for each index
                rect.set_x(rect.get_x() + 1 / float(n_df + 1) * i / float(n_col))
                rect.set_hatch(H * int(i / n_col)) #edited part
                rect.set_width(1 / float(n_df + 1))

    axe.set_xticks((np.arange(0, 2 * n_ind, 2) + 1 / float(n_df + 1)) / 2.)
    axe.set_xticklabels(df.index, rotation = 0)
    axe.set_title(title)

    # Add invisible data to add another legend
    n=[]
    for i in range(n_df):
        n.append(axe.bar(0, 0, color=&quot;gray&quot;, hatch=H * i))

    l1 = axe.legend(h[:n_col], l[:n_col], loc=[1.01, 0.5])
    if labels is not None:
        l2 = plt.legend(n, labels, loc=[1.01, 0.1])
    axe.add_artist(l1)
    return axe

# create fake dataframes
df1 = pd.DataFrame(np.random.rand(4, 5),
                   index=[&quot;A&quot;, &quot;B&quot;, &quot;C&quot;, &quot;D&quot;],
                   columns=[&quot;I&quot;, &quot;J&quot;, &quot;K&quot;, &quot;L&quot;, &quot;M&quot;])
df2 = pd.DataFrame(np.random.rand(4, 5),</code>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn