文字列からの特殊文字、句読点、およびスペースの削除
プログラミング シナリオでは、データのクリーニングには、句読点や空白などの不要な文字の削除が含まれることがよくあります。これを達成するために、文字列から特殊文字、句読点、スペースを削除するという特定のタスクを考えてみましょう。
質問: 文字列からすべての特殊文字、句読点、スペースを削除するにはどうすればよいですか? Python の文字列?
答え:
正規表現に依存せずに、Python の強力な文字列演算子を利用できます:
<code class="python">string = "Special $#! characters spaces 888323" new_string = ''.join(e for e in string if e.isalnum()) print(new_string)</code>
このアプローチでは、 str.isalnum() メソッド。文字が英数字 (文字または数字) かどうかを確認します。他のすべての文字は、英数字のみを含む新しい文字列を構築するリスト内包表記を使用して除外されます。
正規表現を使用したい場合は、次のコード スニペットを使用することもできます。
<code class="python">import re string = "Special $#! characters spaces 888323" new_string = re.sub(r'[^a-zA-Z0-9]', '', string) print(new_string)</code>
この正規表現置換操作は、英数字以外の文字をすべて空の文字列に置き換え、元の文字列からそれらの文字を効果的に削除します。
正規表現と組み込みの文字列メソッドのどちらかを選択する場合、多くの場合後者がよりクリーンな方法を提供することに注意してください。特にこのような単純なタスクの場合、より効率的なソリューションとなります。
以上がPython の文字列からすべての特殊文字、句読点、スペースを削除する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。