理解Pandas 中的「軸」
在使用Pandas 時,「軸」的概念在各種操作中起著關重要的作用,包括統計計算,如平均值。在此上下文中,axis 參數指定執行操作的方向。
預設情況下,axis 值為 0,表示沿著 DataFrame 的行(索引)進行操作。但是,可以將軸值明確設定為 1 以沿列執行操作。
考慮以下範例:
<code class="python">import pandas as pd import numpy as np # Generate a DataFrame with random values dff = pd.DataFrame(np.random.randn(1, 2), columns=list('AB')) # Calculate the mean along each column mean_columns = dff.mean(axis=1)</code>
在這種情況下,指定 axis=1 表示Mean 函數將計算 DataFrame 中每一列的平均值。預期輸出為:
0 1.074821 dtype: float64
這與使用axis=0 時可能預期的結果不同,後者會計算每行的平均值,從而產生以下輸出:
A 0.626386 B 1.523255 dtype: float64
為了進一步澄清,Pandas 中的axis 參數與NumPy 均值函數中axis 的用法一致。當 NumPy 的平均值中未明確指定 axis 時,它預設為 None,這會在計算平均值之前展平數組。因此,在 Pandas 中指定 axis=0 對應於計算沿行的平均值(因為 Pandas 中的索引代表行),而指定 axis=1 對應於計算沿列的平均值。
為了更清楚,也可以用 axis='index' 代替 axis=0,用 axis='columns' 代替 axis=1,明確是在哪個軸上執行操作。
以上是Pandas 中的「軸」如何運作:行與列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!