理解 Pandas 中的“轴”
在使用 Pandas 时,“轴”的概念在各种操作中起着至关重要的作用,包括统计计算,如平均值。在此上下文中,axis 参数指定执行操作的方向。
默认情况下,axis 值为 0,表示沿 DataFrame 的行(索引)进行操作。但是,可以将轴值显式设置为 1 以沿列执行操作。
考虑以下示例:
<code class="python">import pandas as pd import numpy as np # Generate a DataFrame with random values dff = pd.DataFrame(np.random.randn(1, 2), columns=list('AB')) # Calculate the mean along each column mean_columns = dff.mean(axis=1)</code>
在这种情况下,指定 axis=1 意味着Mean 函数将计算 DataFrame 中每一列的平均值。预期输出为:
0 1.074821 dtype: float64
这与使用 axis=0 时可能预期的结果不同,后者会计算每行的平均值,从而产生以下输出:
A 0.626386 B 1.523255 dtype: float64
为了进一步澄清,Pandas 中的 axis 参数与 NumPy 均值函数中 axis 的用法一致。当 NumPy 的平均值中未显式指定 axis 时,它默认为 None,这会在计算平均值之前展平数组。因此,在 Pandas 中指定 axis=0 对应于计算沿行的平均值(因为 Pandas 中的索引代表行),而指定 axis=1 对应于计算沿列的平均值。
为了更清楚,也可以用 axis='index' 代替 axis=0,用 axis='columns' 代替 axis=1,明确是在哪个轴上执行操作。
以上是Pandas 中的“轴”如何工作:行与列?的详细内容。更多信息请关注PHP中文网其他相关文章!