ホームページ  >  記事  >  バックエンド開発  >  Python で文字列から絵文字を削除する方法: 一般的なエラーを修正するための初心者ガイド?

Python で文字列から絵文字を削除する方法: 一般的なエラーを修正するための初心者ガイド?

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-27 14:47:29292ブラウズ

How to Remove Emojis from Strings in Python: A Beginner's Guide to Fixing Common Errors?

Python で文字列から絵文字を削除する

絵文字を削除するための提供された Python コードは、構文エラーが含まれているため失敗します。 Unicode 文字列は、Python 2 では u'' プレフィックスを使用して指定する必要があります。さらに、re.UNICODE フラグを正規表現に渡し、入力データをコーデックを使用して Unicode に変換する必要があります:

<code class="python">import codecs
import re

text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8')
print(text) # with emoji

emoji_pattern = re.compile("["
        u"\U0001F600-\U0001F64F"  # emoticons
        u"\U0001F300-\U0001F5FF"  # symbols & pictographs
        u"\U0001F680-\U0001F6FF"  # transport & map symbols
        u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                           "]+", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji</code>

出力

この犬 ?<br>この犬<br>

メモ:このパターンは、限られた範囲の絵文字のみに一致します。より包括的な解決策については、「Unicode 文字範囲」を参照してください。

以上がPython で文字列から絵文字を削除する方法: 一般的なエラーを修正するための初心者ガイド?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。