Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk menggunakan bahasa Go untuk padanan ungkapan biasa?

Bagaimana untuk menggunakan bahasa Go untuk padanan ungkapan biasa?

PHPz
PHPzasal
2023-06-10 08:30:244183semak imbas

Ungkapan biasa ialah bahasa yang mewakili corak data teks, yang boleh mengenal pasti subrentetan dalam teks yang sepadan dengan corak tertentu dengan cepat. Dalam pengaturcaraan komputer, ungkapan biasa sering digunakan untuk pemadanan rentetan dan operasi carian. Go ialah bahasa yang ditaip kuat dengan prestasi yang cekap dan kelebihan bahasa yang disusun. Artikel ini akan meneroka cara menggunakan ungkapan biasa untuk pemadanan teks dalam bahasa Go.

1. Ungkapan biasa dalam Go

Bahasa Go mempunyai sokongan terbina dalam untuk ungkapan biasa dan pustaka standard menyediakan pakej regexp untuk operasi ungkapan biasa. Pakej regexp terutamanya menyediakan objek Ekspresi Biasa dan satu siri kaedah untuk pemadanan rentetan, penggantian dan pembahagian. Di bawah ini kami akan memperkenalkan jenis data dan kaedah utama dalam pakej regexp.

2. Objek dan kaedah ungkapan biasa

Berikut ialah tiga jenis yang paling penting dalam pakej regexp:

• regexp.Regexp: objek ekspresi biasa, program umum Cipta ungkapan biasa dengan memanggil regexp.Compile.

• regexp.Match: Fungsi ini digunakan untuk menyemak sama ada rentetan mematuhi peraturan ungkapan biasa, seperti menentukan sama ada rentetan mematuhi format e-mel.

• regexp.ReplaceAllString: Fungsi penggantian ungkapan biasa, digunakan untuk menggantikan bahagian rentetan yang mematuhi peraturan ungkapan biasa dengan rentetan lain.

Mari kita lihat penggunaan khusus bagi ketiga-tiga jenis ini.

1. Cipta objek ekspresi biasa

Dalam Go, kita boleh mencipta objek ekspresi biasa dengan memanggil fungsi Compile atau MustCompile dalam pakej regexp, di mana fungsi Compile akan mengembalikan Objek ralat , dan fungsi MustCompile panik secara langsung.

Berikut ialah contoh:

import "regexp"

func main() {
    r, err := regexp.Compile("a.")
    if err != nil {
        panic(err)
    }
}

Selepas penyusunan, r ialah objek jenis regexp.Regexp, yang boleh digunakan untuk memadankan rentetan.

2. Rentetan Padanan

Dalam Go, anda boleh menggunakan fungsi Match, MatchString dan MatchReader dalam pakej regexp untuk menyemak sama ada rentetan mematuhi peraturan ungkapan biasa.

  • Fungsi Padanan sering digunakan untuk menyemak sama ada rentetan mematuhi peraturan ungkapan biasa Fungsi mengembalikan nilai Boolean, benar menunjukkan padanan yang berjaya, palsu menunjukkan padanan yang gagal.
import "regexp"

func main() {
    r, _ := regexp.Compile("a.")
    str := "all"
    result := r.MatchString(str)
    fmt.Println(result)  // true
}

Dalam contoh di atas, gunakan fungsi Compile untuk mencipta objek ungkapan biasa r, dan kemudian panggil fungsi MatchString untuk dipadankan.

  • Fungsi MatchString ialah fungsi pintasan yang digunakan untuk menyemak sama ada rentetan mematuhi peraturan ungkapan biasa dan juga mengembalikan nilai Boolean.
import "regexp"

func main() {
    str := "all"
    result, _ := regexp.MatchString("a.", str)
    fmt.Println(result)  // true
}
  • Fungsi MatchReader digunakan untuk membaca data rentetan daripada antara muka io.Reader dan memadankannya.
import (
    "bufio"
    "os"
    "regexp"
)

func main() {
    r, _ := regexp.Compile("a.")
    scanner := bufio.NewScanner(os.Stdin)
    for scanner.Scan() {
        str := scanner.Text()
        result := r.MatchString(str)
        fmt.Println(result)
    }
}

Dalam contoh di atas, fungsi scanner.Text() digunakan untuk membaca baris rentetan daripada input standard, dan kemudian fungsi r.MatchString digunakan untuk pemadanan.

3. Penggantian rentetan

Gunakan fungsi Regexp.ReplaceAllString untuk menggantikan rentetan yang mematuhi peraturan ungkapan biasa dengan rentetan yang ditentukan.

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile("a.")
    str := "all"
    repl := "o"
    result := r.ReplaceAllString(str, repl)
    fmt.Println(result)  // o
}

Dalam contoh di atas, gunakan fungsi Compile untuk mencipta objek ungkapan biasa r, dan kemudian panggil fungsi ReplaceAllString untuk menggantikannya.

3. Sintaks ungkapan biasa

Apabila menggunakan ungkapan biasa dalam Go, anda perlu memahami sintaks ungkapan biasa. Berikut ialah beberapa metakarakter ungkapan biasa biasa:

• .: Padan dengan mana-mana aksara.

• d: Padankan nombor.

• D: Padan dengan aksara bukan angka.

• s: Padan dengan ruang dan tab.

• S: Padan dengan aksara bukan ruang putih.

• w: Padankan aksara perkataan.

• W: Padankan aksara bukan perkataan.

• ^: Padan dengan permulaan rentetan.

• $: Padan dengan hujung rentetan.

• *: Padankan 0 atau lebih aksara.

• +: Padankan 1 atau lebih aksara.

• ?: Padankan 0 atau 1 aksara.

• []: Padankan mana-mana watak yang muncul dalam set.

• [^]: Menunjukkan padanan mana-mana watak yang tiada dalam set.

• (): Menunjukkan pengumpulan.

• |: Menunjukkan logik ATAU.

Berikut ialah contoh padanan tarikh melalui ungkapan biasa:

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`d{4}-d{2}-d{2}`)
    str := "today is 2021-08-11"
    result := r.FindString(str)
    fmt.Println(result)  // 2021-08-11
}

Dalam contoh di atas, cipta objek ungkapan biasa melalui fungsi regexp.Compile dan kemudian gunakan d{4}-d{2}-d{2} biasa ungkapan Ungkapan sepadan dengan tarikh dalam rentetan.

4. Ringkasan

Artikel ini memperkenalkan kaedah menggunakan ungkapan biasa untuk pemadanan teks dalam bahasa Go. Kami membincangkan jenis dan kaedah data utama dalam pakej regexp, serta sintaks asas ungkapan biasa. Saya harap artikel ini dapat membantu pembaca lebih memahami padanan ungkapan biasa dalam bahasa Go.

Atas ialah kandungan terperinci Bagaimana untuk menggunakan bahasa Go untuk padanan ungkapan biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn