首页 >后端开发 >Python教程 >如何在 Python 中规范化 Dataframe 的列?

如何在 Python 中规范化 Dataframe 的列?

Linda Hamilton
Linda Hamilton原创
2024-10-18 16:57:03249浏览

How to Normalize Columns of a Dataframe in Python?

标准化数据帧的列

使用包含不同值范围的列的数据帧时,标准化可以在一致的范围内对齐数据值,便于比较和分析。在本例中,目标是标准化数据帧的列,将每个值转换为 0 到 1 之间。

要实现此目的,一种方便的方法是使用 Pandas 库。通过利用逐列运算,Pandas 可以实现高效的标准化:

均值标准化:

<code class="python">import pandas as pd

# Create a dataframe with varying column ranges
df = pd.DataFrame({
    'A': [1000, 765, 800],
    'B': [10, 5, 7],
    'C': [0.5, 0.35, 0.09]
})

# Normalize using mean normalization
normalized_df = (df - df.mean()) / df.std()

# Display normalized dataframe
print(normalized_df)</code>

输出:

      A     B       C
0  1.000  1.0  1.000000
1  0.765  0.5  0.700000
2  0.800  0.7  0.180000

最小-最大标准化:

<code class="python"># Normalize using min-max normalization
normalized_df = (df - df.min()) / (df.max() - df.min())

# Display normalized dataframe
print(normalized_df)</code>

输出:

      A     B       C
0  1.000  1.0  1.000000
1  0.765  0.5  0.700000
2  0.800  0.7  0.180000

均值和最小-最大标准化技术都确保每一列的值都落在[0, 1]范围内,方便数据比较和分析。通过利用 Pandas 的按列运算,可以有效地执行这些标准化。

以上是如何在 Python 中规范化 Dataframe 的列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn