正規表現はテキスト データ パターンを表す言語であり、特定のパターンに一致するテキスト内の部分文字列を迅速に識別できます。コンピューター プログラミングでは、正規表現は文字列の一致や検索操作によく使用されます。 Go は、効率的なパフォーマンスとコンパイル言語の利点を備えた強力に型指定された言語です。この記事では、Go 言語でのテキスト マッチングに正規表現を使用する方法を説明します。
1. Go の正規表現
Go 言語には正規表現のサポートが組み込まれており、標準ライブラリには正規表現操作用の regexp パッケージが用意されています。 regexp パッケージは主に、正規表現オブジェクトと、文字列の一致、置換、およびセグメント化のための一連のメソッドを提供します。以下に、regexp パッケージの主なデータ型とメソッドを紹介します。
2. 正規表現オブジェクトとメソッド
次は、regexp パッケージの 3 つの最も重要なタイプです:
• regexp.Regexp: 正規表現オブジェクト、一般的なプログラム Create regexp.Compile を呼び出して正規表現を作成します。
• regexp.Match: この関数は、文字列が電子メール形式に準拠しているかどうかを判断するなど、文字列が正規表現のルールに準拠しているかどうかを確認するために使用されます。
• regexp.ReplaceAllString: 正規表現置換関数。正規表現ルールに準拠する文字列の一部を別の文字列に置換するために使用されます。
これら 3 つのタイプの具体的な使用法を見てみましょう。
1. 正規表現オブジェクトを作成する
Go では、regexp パッケージで Compile または MustCompile 関数を呼び出すことで正規表現オブジェクトを作成できます。Compile 関数はエラー オブジェクトを返します。と、MustCompile 関数が直接パニックになります。
以下は例です:
import "regexp" func main() { r, err := regexp.Compile("a.") if err != nil { panic(err) } }
コンパイルが完了すると、r は regexp.Regexp 型のオブジェクトになり、文字列の一致に使用できます。
2. 文字列の一致
Go では、regexp パッケージの Match、MatchString、および MatchReader 関数を使用して、文字列が正規表現ルールに準拠しているかどうかを確認できます。
import "regexp" func main() { r, _ := regexp.Compile("a.") str := "all" result := r.MatchString(str) fmt.Println(result) // true }
上の例では、Compile 関数を使用して正規表現オブジェクト r を作成し、照合のために MatchString 関数を呼び出します。
import "regexp" func main() { str := "all" result, _ := regexp.MatchString("a.", str) fmt.Println(result) // true }
import ( "bufio" "os" "regexp" ) func main() { r, _ := regexp.Compile("a.") scanner := bufio.NewScanner(os.Stdin) for scanner.Scan() { str := scanner.Text() result := r.MatchString(str) fmt.Println(result) } }
上記の例では、scanner.Text() 関数を使用して標準入力から文字列を 1 行読み取り、次に r.MatchString 関数を使用して照合します。
3. 文字列の置換
Regexp.ReplaceAllString 関数を使用して、正規表現ルールに準拠する文字列を指定した文字列に置き換えます。
import ( "fmt" "regexp" ) func main() { r, _ := regexp.Compile("a.") str := "all" repl := "o" result := r.ReplaceAllString(str, repl) fmt.Println(result) // o }
上の例では、Compile 関数を使用して正規表現オブジェクト r を作成し、次に ReplaceAllString 関数を呼び出して置換します。
3. 正規表現の構文
Go で正規表現を使用する場合は、正規表現の構文を理解する必要があります。一般的な正規表現メタ文字の一部を以下に示します。
• .: 任意の文字と一致します。
• d: 数字を一致させます。
• D: 数字以外の文字と一致します。
• s: スペースとタブに一致します。
• S: 空白文字以外の文字と一致します。
• w: 単語の文字と一致します。
• W: 単語以外の文字と一致します。
• ^: 文字列の先頭と一致します。
• $: 文字列の末尾と一致します。
• *: 0 個以上の文字と一致します。
• : 1 つ以上の文字と一致します。
• ?: 0 または 1 文字と一致します。
• []: セット内に出現する任意の文字と一致します。
• [^]: セットにない任意の文字と一致することを示します。
• (): グループ化を示します。
• |:論理和を示します。
次は、正規表現を使用して日付を照合する例です。
import ( "fmt" "regexp" ) func main() { r, _ := regexp.Compile(`d{4}-d{2}-d{2}`) str := "today is 2021-08-11" result := r.FindString(str) fmt.Println(result) // 2021-08-11 }
上の例では、regexp.Compile
関数を使用して正規表現オブジェクトを作成し、次にd{4}-d{2}-d{2}
を使用します。この正規表現は文字列内の日付と一致します。
4. まとめ
この記事では、Go 言語で正規表現を使ってテキストマッチングを行う方法を紹介します。 regexp パッケージの主なデータ型とメソッド、および正規表現の基本構文について説明しました。この記事が読者の Go 言語での正規表現マッチングの理解を深められることを願っています。
以上が正規表現マッチングに Go 言語を使用するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。