Heim >Backend-Entwicklung >Python-Tutorial >Wie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?

Wie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne: 2023-05-07 14:55:082948Durchsuche

Einführung

pd.MultiIndex, ein Index mit mehreren Ebenen. Durch mehrstufige Indizes können wir die Daten der gesamten Indexgruppe verwalten. In diesem Artikel werden hauptsächlich 6 Möglichkeiten zum Erstellen mehrstufiger Indizes in Pandas vorgestellt:

pd.MultiIndex.from_arrays(): Mehrdimensionale Arrays werden als Parameter verwendet, hohe Dimensionalität gibt Indizes auf hoher Ebene an und niedrige Dimensionalität spezifiziert Low-Level-Indizes.
pd.MultiIndex.from_tuples(): Liste von Tupeln als Argument, wobei jedes Tupel jeden Index angibt (hoch- und niedrigdimensionaler Index).
pd.MultiIndex.from_product(): Eine Liste iterierbarer Objekte wird als Parameter verwendet und der Index wird basierend auf dem kartesischen Produkt (paarweise Kombination von Elementen) mehrerer iterierbarer Objektelemente erstellt.
pd.MultiIndex.from_frame: Direkt generiert basierend auf dem vorhandenen Datenrahmen
groupby(): Erhalten durch Datengruppierungsstatistiken
pivot_table(): Erhalten durch Generieren einer Pivot-Tabelle

pd .MultiIndex.from_arrays()

In [1]:

import pandas as pd
import numpy as np

wird durch ein Array generiert, das normalerweise die Elemente in der Liste angibt:

In [2]:

# 列表元素是字符串和数字
array1 = [["xiaoming","guanyu","zhangfei"], 
          [22,25,27]
         ]
m1 = pd.MultiIndex.from_arrays(array1)
m1

Out[2]:

MultiIndex([(&#39;xiaoming&#39;, 22),            (  &#39;guanyu&#39;, 25),            (&#39;zhangfei&#39;, 27)],
           )

In [ 3]:

type(m1)  # 查看数据类型

Sehen Sie sich den Datentyp über die Typfunktion an und stellen Sie fest, dass es sich tatsächlich um: MultiIndex

Out[3]:

pandas.core.indexes.multi.MultiIndex

Sie können beim Erstellen den Namen jeder Ebene angeben:

In [4]:

# 列表元素全是字符串
array2 = [["xiaoming","guanyu","zhangfei"],
          ["male","male","female"]
         ]
m2 = pd.MultiIndex.from_arrays(
	array2, 
  # 指定姓名和性别
  names=["name","sex"])
m2

Out[4]:

MultiIndex([(&#39;xiaoming&#39;,   &#39;male&#39;),            (  &#39;guanyu&#39;,   &#39;male&#39;),            (&#39;zhangfei&#39;, &#39;female&#39;)],
           names=[&#39;name&#39;, &#39;sex&#39;])

Das folgende Beispiel generiert drei Ebenen von Indizes und gibt Namen an:

In [5]:

array3 = [["xiaoming","guanyu","zhangfei"],
          ["male","male","female"],
          [22,25,27]
         ]
m3 = pd.MultiIndex.from_arrays(
	array3, 
	names=["姓名","性别","年龄"])
m3

Out[5]:

MultiIndex([(&#39;xiaoming&#39;,   &#39;male&#39;, 22),            (  &#39;guanyu&#39;,   &#39;male&#39;, 25),            (&#39;zhangfei&#39;, &#39;female&#39;, 27)],
           names=[&#39;姓名&#39;, &#39;性别&#39;, &#39;年龄&#39;])

pd.MultiIndex.from_tuples ()

Generieren Sie mehrstufige Indizes in Form von Tupeln:

In [6]:

# 元组的形式
array4 = (("xiaoming","guanyu","zhangfei"), 
          (22,25,27)
         )
m4 = pd.MultiIndex.from_arrays(array4)
m4

Out[6]:

MultiIndex([(&#39;xiaoming&#39;, 22),            (  &#39;guanyu&#39;, 25),            (&#39;zhangfei&#39;, 27)],
           )

In [7]:

# 元组构成的3层索引
array5 = (("xiaoming","guanyu","zhangfei"),
          ("male","male","female"),
          (22,25,27))
m5 = pd.MultiIndex.from_arrays(array5)
m5

Out[7]:

MultiIndex([(&#39;xiaoming&#39;,   &#39;male&#39;, 22),            (  &#39;guanyu&#39;,   &#39;male&#39;, 25),            (&#39;zhangfei&#39;, &#39;female&#39;, 27)],
           )

Liste und Tupel können sein gemischt

Die äußerste Ebene ist eine Liste Liste iterierbarer Objekte als Parameter und erstellt einen Index basierend auf dem kartesischen Produkt (paarweise Kombination von Elementen) mehrerer iterierbarer Objektelemente.

, um zu bestimmen, ob ein Python-Objekt iterierbar ist:

array6 = [("xiaoming","guanyu","zhangfei"),
          ("male","male","female"),
          (18,35,27)
         ]
# 指定名字
m6 = pd.MultiIndex.from_arrays(array6,names=["姓名","性别","年龄"])
m6

Durch das obige Beispiel fassen wir zusammen: Gemeinsame Zeichenfolgen, Listen, Mengen, Tupel und Wörterbücher sind alle iterierbar Objekt

Das Folgende ist ein Beispiel zur Veranschaulichung:

In [18]:

MultiIndex([(&#39;xiaoming&#39;,   &#39;male&#39;, 18),            (  &#39;guanyu&#39;,   &#39;male&#39;, 35),            (&#39;zhangfei&#39;, &#39;female&#39;, 27)],
           names=[&#39;姓名&#39;, &#39;性别&#39;, &#39;年龄&#39;] # 指定名字
           )

isinstance()Out[18]:

# 导入 collections 模块的 Iterable 对比对象
from collections import Iterable

In [19]: Wie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?

names = ["xiaoming","guanyu","zhangfei"]
numbers = [22,25]
m7 = pd.MultiIndex.from_product(
    [names, numbers], 
    names=["name","number"]) # 指定名字
m7

Out[19]:

MultiIndex([(&#39;xiaoming&#39;, 22),            (&#39;xiaoming&#39;, 25),            (  &#39;guanyu&#39;, 22),            (  &#39;guanyu&#39;, 25),            (&#39;zhangfei&#39;, 22),            (&#39;zhangfei&#39;, 25)],
           names=[&#39;name&#39;, &#39;number&#39;])

Wie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?

In [20]:

# 需要展开成列表形式
strings = list("abc") 
lists = [1,2]
m8 = pd.MultiIndex.from_product(
	[strings, lists],
	names=["alpha","number"])
m8

Out[20]:

MultiIndex([(&#39;a&#39;, 1),            (&#39;a&#39;, 2),            (&#39;b&#39;, 1),            (&#39;b&#39;, 2),            (&#39;c&#39;, 1),            (&#39;c&#39;, 2)],
           names=[&#39;alpha&#39;, &#39;number&#39;])

In [21]:

# 使用元组形式
strings = ("a","b","c") 
lists = [1,2]
m9 = pd.MultiIndex.from_product(
	[strings, lists],
	names=["alpha","number"])
m9

Out[21]:

MultiIndex([(&#39;a&#39;, 1),            (&#39;a&#39;, 2),            (&#39;b&#39;, 1),            (&#39;b&#39;, 2),            (&#39;c&#39;, 1),            (&#39;c&#39;, 2)],
           names=[&#39;alpha&#39;, &#39;number&#39;])

In [22]:

# 使用range函数
strings = ("a","b","c")  # 3个元素
lists = range(3)  # 0,1,2  3个元素
m10 = pd.MultiIndex.from_product(
	[strings, lists],
	names=["alpha","number"])
m10

Die Gesamtzahl ist „332=18“:

Out[ 22 ]:

MultiIndex([(&#39;a&#39;, 0),            (&#39;a&#39;, 1),            (&#39;a&#39;, 2),            (&#39;b&#39;, 0),            (&#39;b&#39;, 1),            (&#39;b&#39;, 2),            (&#39;c&#39;, 0),            (&#39;c&#39;, 1),            (&#39;c&#39;, 2)],
           names=[&#39;alpha&#39;, &#39;number&#39;])

pd.MultiIndex.from_frame()

Erzeugen Sie direkt einen mehrstufigen Index über den vorhandenen DataFrame:

# 使用range函数
strings = ("a","b","c") 
list1 = range(3)  # 0,1,2
list2 = ["x","y"]
m11 = pd.MultiIndex.from_product(
	[strings, list1, list2],
  names=["name","l1","l2"]
  )
m11  # 总个数 3*3*2=18

Der mehrstufige Index wird direkt generiert und der Name ist das Spaltenfeld von der vorhandene Datenrahmen:

In [24]:

MultiIndex([(&#39;a&#39;, 0, &#39;x&#39;),            (&#39;a&#39;, 0, &#39;y&#39;),            (&#39;a&#39;, 1, &#39;x&#39;),            (&#39;a&#39;, 1, &#39;y&#39;),            (&#39;a&#39;, 2, &#39;x&#39;),            (&#39;a&#39;, 2, &#39;y&#39;),            (&#39;b&#39;, 0, &#39;x&#39;),            (&#39;b&#39;, 0, &#39;y&#39;),            (&#39;b&#39;, 1, &#39;x&#39;),            (&#39;b&#39;, 1, &#39;y&#39;),            (&#39;b&#39;, 2, &#39;x&#39;),            (&#39;b&#39;, 2, &#39;y&#39;),            (&#39;c&#39;, 0, &#39;x&#39;),            (&#39;c&#39;, 0, &#39;y&#39;),            (&#39;c&#39;, 1, &#39;x&#39;),            (&#39;c&#39;, 1, &#39;y&#39;),            (&#39;c&#39;, 2, &#39;x&#39;),            (&#39;c&#39;, 2, &#39;y&#39;)],
           names=[&#39;name&#39;, &#39;l1&#39;, &#39;l2&#39;])

Out[24]:

df = pd.DataFrame({"name":["xiaoming","guanyu","zhaoyun"],
                  "age":[23,39,34],
                  "sex":["male","male","female"]})
df

Geben Sie den Namen über den Namensparameter an:

In [25]:

pd.MultiIndex.from_frame(df)

Out[25]:

MultiIndex([(&#39;xiaoming&#39;, 23,   &#39;male&#39;),            (  &#39;guanyu&#39;, 39,   &#39;male&#39;),            ( &#39;zhaoyun&#39;, 34, &#39;female&#39;)],
           names=[&#39;name&#39;, &#39;age&#39;, &#39;sex&#39;])

groupby ()

durch die Groupby-Funktion Die Gruppierungsfunktion wird wie folgt berechnet:

In [26]:

# 可以自定义名字
pd.MultiIndex.from_frame(df,names=["col1","col2","col3"])

Out[26]:

MultiIndex([(&#39;xiaoming&#39;, 23,   &#39;male&#39;),            (  &#39;guanyu&#39;, 39,   &#39;male&#39;),            ( &#39;zhaoyun&#39;, 34, &#39;female&#39;)],
           names=[&#39;col1&#39;, &#39;col2&#39;, &#39;col3&#39;])

Index der Daten anzeigen:

In [ 28]:

df1 = pd.DataFrame({"col1":list("ababbc"),
                   "col2":list("xxyyzz"),
                   "number1":range(90,96),
                   "number2":range(100,106)})
df1

Out[28]:

df2 = df1.groupby(["col1","col2"]).agg({"number1":sum,
                                        "number2":np.mean})
df2

pivot_table()

wird über die Pivot-Funktion erhalten: Wie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?

In [29]:

df2.index

In [30]:

MultiIndex([(&#39;a&#39;, &#39;x&#39;),            (&#39;a&#39;, &#39;y&#39;),            (&#39;b&#39;, &#39;x&#39;),            (&#39;b&#39;, &#39;y&#39;),            (&#39;b&#39;, &#39;z&#39;),            (&#39;c&#39;, &#39;z&#39;)],
           names=[&#39;col1&#39;, &#39;col2&#39;])

Out[30 ]:

df3 = df1.pivot_table(values=["col1","col2"],index=["col1","col2"])
df3

Das obige ist der detaillierte Inhalt vonWie erstelle ich einen mehrstufigen Index (MultiIndex) mit der Pandas-Bibliothek von Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Dieser Artikel ist reproduziert unter:yisu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Metaprogrammierung in Python und seinen AnwendungenNächster Artikel：Metaprogrammierung in Python und seinen Anwendungen

In Verbindung stehende Artikel

Mehr sehen