从 DataFrame 列中的字符串中消除不需要的字符
处理包含字符串数据的数据集时,通常需要从内部提取有意义的信息字符串。然而,不需要的字符或格式可能会掩盖所需的数据。在这种情况下,目标是有效地删除这些不需要的部分。
假设我们有一个包含以下数据的 DataFrame 列:
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
我们的目标是修剪数据以删除' ' 或 '-' 前缀以及 'a' 或 'b' 后缀。所需的输出是:
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
为了实现这一点,我们在 map 方法中使用 lambda 函数。以下代码片段完成该任务:
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
lstrip 函数删除任何前导 ' ' 或 '-' 字符,而 rstrip 函数删除任何尾随 'a'、'A'、'b'、 “B”或“c”字符。输出是一个包含所需修剪数据的 DataFrame。
以上是如何从数据帧中的字符串列中删除不需要的字符?的详细内容。更多信息请关注PHP中文网其他相关文章!