标准化数据帧的列
使用包含不同值范围的列的数据帧时,标准化可以在一致的范围内对齐数据值,便于比较和分析。在本例中,目标是标准化数据帧的列,将每个值转换为 0 到 1 之间。
要实现此目的,一种方便的方法是使用 Pandas 库。通过利用逐列运算,Pandas 可以实现高效的标准化:
均值标准化:
<code class="python">import pandas as pd # Create a dataframe with varying column ranges df = pd.DataFrame({ 'A': [1000, 765, 800], 'B': [10, 5, 7], 'C': [0.5, 0.35, 0.09] }) # Normalize using mean normalization normalized_df = (df - df.mean()) / df.std() # Display normalized dataframe print(normalized_df)</code>
输出:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
最小-最大标准化:
<code class="python"># Normalize using min-max normalization normalized_df = (df - df.min()) / (df.max() - df.min()) # Display normalized dataframe print(normalized_df)</code>
输出:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
均值和最小-最大标准化技术都确保每一列的值都落在[0, 1]范围内,方便数据比较和分析。通过利用 Pandas 的按列运算,可以有效地执行这些标准化。
以上是如何在 Python 中规范化 Dataframe 的列?的详细内容。更多信息请关注PHP中文网其他相关文章!