使用字典重新映射 Pandas 列中的值,同时保留 NaN
在处理数据帧的上下文中,通常需要更改基于定义的映射的特定列。考虑这样一个场景,您有一个包含预定义值翻译的字典,例如 di = {1: "A", 2: "B"},并且您希望将这些映射应用到名为 col1 的 pandas 列。目标是相应地修改 col1 中的值,同时保持 NaN 值不变。
实现此转换的一种高效方法是利用 pandas 的 .replace 方法。该方法允许用指定的目标值替换特定值或范围。以下是实现它的方法:
import pandas as pd import numpy as np # Example DataFrame df = pd.DataFrame({'col2': {0: 'a', 1: 2, 2: np.nan}, 'col1': {0: 'w', 1: 1, 2: 2}}) # Mapping dictionary di = {1: "A", 2: "B"} # Apply value remapping using .replace df.replace({"col1": di}, inplace=True) # Output DataFrame with remapped values while preserving NaN print(df)
在此示例中,.replace 方法采用字典作为参数,其中键表示 col1 中的原始值,值表示所需的重新映射值。通过将 inplace 参数设置为 True,可以直接修改原始数据帧,从而无需重新分配。
或者,如果您希望将转换专门应用于 col1 系列,则可以使用以下语法:
df["col1"].replace(di, inplace=True)
此方法可确保 NaN 值不受影响,因为 NaN 不是映射字典中的键。
以上是如何使用字典重新映射 Pandas 列值,同时保留 NaN 值?的详细内容。更多信息请关注PHP中文网其他相关文章!