ホームページ >バックエンド開発 >Python チュートリアル >最初の英数字以外の文字まで文字列を抽出する Python プログラム
Python 文字列は、情報またはデータを表す文字のシーケンスです。通常の文字列には、一重引用符または二重引用符で囲まれたさまざまな文字を含めることができますが、英数字文字列には、数字と文字のみが含まれます。 英数字文字列と非英数字文字列は両方とも、パスワード保護、データ処理と検証、書式設定などのさまざまなシナリオで使用および適用されます。
特定のパターンを識別して抽出できます。これらのタイプの文字列を使用して、さまざまな組み合わせを提供することもできます。これらの文字列に基づいて操作を実行します。私たちの仕事は、最初の英数字以外の文字が見つかるまで文字列を抽出することです。
英数字以外の文字が出現する前に、元の文字列から部分文字列を抽出する必要があります。例を通してこれを理解しましょう。
次の値を持つ辞書を考えてみましょう -
リーリー指定された文字列は、文字、数字、特殊文字で構成されます。英数字以外の文字が見つかったら、部分文字列を取得する必要があります。
リーリーこの後に英数字以外の文字、つまり「@」が出現したため、元の文字列から部分文字列「Sales18」が返されたことがわかります。問題の内容を理解したところで、いくつかの解決策について説明します。
これは、指定された条件に基づいて文字列を抽出する基本的で簡単な方法です。文字列を渡し、すべての英数字、つまり文字 (大文字と小文字) と数字を格納する新しい変数を作成します。その後、元の文字列を調べて各文字を繰り返し処理します。
元の文字列内の文字が英数字であるかどうかを確認する条件を作成します。英数字以外の文字が見つかると、ループが中断され、部分文字列が返されます。
###例###正規表現モジュール Search() を使用する
」関数を使用して、式「\W 」で表される非英数字パターンの文字列を検索します。 "\W" は英数字以外のクラスを示し、" " は英数字以外の文字の連続一致ロジックを設定します。
「.start()」メソッドは、一致する部分文字列の開始インデックスを返します。このインデックス値は、目的の部分文字列を取得するために使用されます。 ###例### 以下は例です - リーリー ###出力### リーリー 正規表現モジュール Findall() を使用する
" 関数を使用して、英数字で構成される部分文字列の出現をすべて検索します。
」を使用します。これは、行内の 0 個以上の英数字を表します。 正規表現記号 "
\d" は 0 から 9 までの任意の数値に一致し、"A-Z" は A から Z までの任意の大文字に一致します。" a-z" " は、a と z の間の任意の小文字に一致します。
###例###以下は例です - リーリー ###出力### リーリー Isalnum() メソッドを使用する このメソッドでは、元の文字列内の各文字のインデックスを繰り返し、インデックス "x" の文字が英数字でないかどうかを確認する条件を構築します。これは、文字列の英数字の性質を決定する「
isalnum()以下は例です -
リーリー ###出力### リーリー ###結論は###」関数を使用して関連する文字列を抽出します。最後に、リストのスライスに基づく別の解決策について説明しました。これには、「isalnum()」メソッドの使用が含まれます。
以上が最初の英数字以外の文字まで文字列を抽出する Python プログラムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。