ホームページ >バックエンド開発 >Python チュートリアル >Pythonで句読点を削除する方法
句読点は削除されているので、当然正規表現が使用されます。
#正規表現。正規表現とも呼ばれます。 (英語: Regular Expression、コード内では regex、regexp、または RE と略されることがよくあります)、コンピューター サイエンスの概念。正規表現は、特定のパターン (ルール) に一致するテキストを取得および置換するためによく使用されます。 (推奨学習:Python ビデオ チュートリアル )
正規表現は文字列操作の論理式であり、事前に定義されたいくつかの特定の文字と、これらの特定の文字の組み合わせを使用します。 「ルール文字列」。この「ルール文字列」は、文字列のフィルタリング ロジックを表現するために使用されます。
正規表現と別の文字列を指定すると、次の目標を達成できます:
1. 指定された文字列が正規表現に準拠しているかどうか フィルタリング ロジック式の数 (「マッチング」と呼ばれます):
2. 正規表現を使用して、文字列から必要な特定の部分を取得できます。
文字列内の句読点をフィルタリングして、句読点を削除または置換できます。
import re punctuation = '!,;:?"\'' def removePunctuation(text): text = re.sub(r'[{}]+'.format(punctuation),'',text) return text.strip().lower() text = " Hello, world! " print removePunctuation(text)
正規表現の特徴は次のとおりです:
1. 非常に柔軟、論理的かつ機能的;
2. 複雑な制御を迅速に実現できます。非常に簡単な方法で文字列を取得します。
3. 初めての方にとっては、これは比較的わかりにくいかもしれません。
Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。
以上がPythonで句読点を削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。