DataFrame 列の文字列から不要な文字を削除する
文字列データを含むデータセットを扱う場合、多くの場合、データセット内から意味のある情報を抽出する必要があります。文字列。ただし、不要な文字や書式設定により、目的のデータが見えにくくなる可能性があります。このシナリオの目標は、これらの不要な部分を効率的に削除することです。
次のデータを含む DataFrame 列があるとします。
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
目的は、データをトリミングして、 「 」または「-」プレフィックスと「a」または「b」サフィックス。望ましい出力は次のとおりです:
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
これを実現するには、map メソッド内で lambda 関数を使用します。次のコード スニペットは、このタスクを実行します。
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
lstrip 関数は先頭の ' ' または '-' 文字を削除し、rstrip 関数は末尾の 'a'、'A'、'b'、 「B」または「c」文字。出力は、必要なトリミングされたデータを含む DataFrame です。
以上がDataFrame の文字列列から不要な文字を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。