高效清理 DataFrame 列字符串
从 DataFrame 列中的字符串中删除不需要的部分是数据清理中的常见任务。这可能需要删除特定字符、前缀或后缀。
考虑具有以下数据结构的 DataFrame:
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
我们的目标是从每个“结果”中提取数字部分' 字符串,删除 ' ' 和 '-' 符号以及尾随字符。所需的输出应如下所示:
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
要实现此目的,我们可以利用 Python 的 lambda 函数。以下代码有效地清理“结果”列数据:
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
此 lambda 函数迭代“结果”列中的每个元素:
通过应用这些操作,我们获得了所需的结果,并从“结果”列中的字符串中删除了不需要的部分。
以上是如何使用Python的Lambda函数高效清理DataFrame列字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!