Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Corak reka bentuk ETL dalam bahasa Go

Corak reka bentuk ETL dalam bahasa Go

WBOY
WBOYasal
2023-06-01 21:01:501226semak imbas

Dengan pertumbuhan dan kerumitan data, ETL (Extract, Transform, Load) telah menjadi bahagian penting dalam pemprosesan data. Sebagai bahasa pengaturcaraan yang cekap dan ringan, bahasa Go menjadi semakin popular di kalangan orang ramai. Artikel ini akan memperkenalkan corak reka bentuk ETL yang biasa digunakan dalam bahasa Go untuk membantu pembaca memproses data dengan lebih baik.

1. Corak reka bentuk pengekstrak

Pengekstrak merujuk kepada komponen yang mengekstrak data daripada data sumber termasuk pembacaan fail, bacaan pangkalan data, panggilan API, dsb. Dalam bahasa Go, berbilang goroutin boleh digunakan untuk membaca data daripada data sumber pada masa yang sama untuk meningkatkan kecekapan.

Kunci untuk menggunakan bahasa Go untuk melaksanakan corak reka bentuk Extractor ialah cara menggunakan ciri serentak goroutine dengan betul. Saluran boleh digunakan untuk menyelaraskan operasi segerak dan tak segerak bagi berbilang goroutin. Berikut ialah contoh penggunaan goroutine dan saluran untuk membaca fail secara serentak:

func readFile(file string, out chan<- string) {
      f, err := os.Open(file)
      if err != nil {
           log.Fatal(err)
      }
      defer f.Close()

      scanner := bufio.NewScanner(f)
      for scanner.Scan() {
           out <- scanner.Text()
      }
      close(out)
}

func main() {
      ch := make(chan string)
      go readFile("data.txt", ch)

      for line := range ch {
           fmt.Println(line)
      }
}

Dengan membina fungsi readFile untuk membaca fail, goroutine dan saluran digunakan untuk mencapai kesan membaca kandungan fail secara serentak. Satu goroutine menghantar setiap baris data yang dibaca dari fail ke saluran, dan goroutine yang lain membaca setiap baris dari saluran melalui gelung for.

2. Corak reka bentuk Transformer

Transformer merujuk kepada komponen yang memproses dan menukar data yang diekstrak oleh Extractor yang biasa digunakan termasuk penapisan, pembersihan, penukaran, dsb. Dalam bahasa Go, logik pemprosesan Transformer boleh dilaksanakan dengan menggunakan fungsi.

Kelebihan menggunakan fungsi untuk melaksanakan corak reka bentuk Transformer ialah ia boleh memisahkan logik perniagaan dan logik pemprosesan data, menjadikan kod lebih jelas dan mudah dibaca. Berikut ialah contoh menggunakan fungsi untuk melaksanakan Transformer:

type Person struct {
      Name    string
      Age     int
      Gender  string
}

func transform(data string) Person {
      fields := strings.Split(data, ",")
      age, _ := strconv.Atoi(fields[1])
      return Person{
           Name:    fields[0],
           Age:     age,
           Gender:  fields[2],
      }
}

func main() {
      rawData := []string{"Tom,30,Male", "Mary,25,Female"}

      for _, data := range rawData {
           person := transform(data)
           fmt.Println(person)
      }
}

Dengan membina struktur Orang dan fungsi transformasi, fungsi itu digunakan untuk menukar setiap data rentetan yang diekstrak daripada data sumber kepada struktur Orang. proses pemprosesan badan.

3. Corak reka bentuk pemuat

Pemuat merujuk kepada komponen yang memuatkan data yang diproses oleh Transformer ke dalam storan sasaran yang biasa digunakan termasuk fail, pangkalan data, baris gilir mesej, dsb. Dalam bahasa Go, storan sasaran yang berbeza boleh dicapai dengan menggunakan perpustakaan pihak ketiga.

Kelebihan menggunakan perpustakaan pihak ketiga untuk melaksanakan corak reka bentuk Loader ialah ia boleh mengurangkan jumlah kod, meningkatkan kualiti kod dan mengurangkan risiko ralat. Berikut ialah contoh menggunakan perpustakaan pihak ketiga untuk melaksanakan Loader:

type Person struct {
      Name    string
      Age     int
      Gender  string
}

func saveData(p Person) {
      db, err := sql.Open("mysql", "user:password@tcp(host:port)/dbname")
      if err != nil {
           log.Fatal(err)
      }
      defer db.Close()

      stmt, err := db.Prepare("INSERT INTO person(name, age, gender) VALUES (?, ?, ?)")
      if err != nil {
           log.Fatal(err)
      }
      defer stmt.Close()

      _, err = stmt.Exec(p.Name, p.Age, p.Gender)
      if err != nil {
           log.Fatal(err)
      }
}

func main() {
      data := Person{Name: "Tom", Age: 30, Gender: "Male"}
      saveData(data)
}

Dengan membina struktur Orang dan fungsi saveData, sql perpustakaan pihak ketiga digunakan untuk melaksanakan proses menyimpan data struktur Orang ke dalam pangkalan data MySQL.

Ringkasan

Dalam bahasa Go, data boleh diproses dengan mudah dan berkesan menggunakan corak reka bentuk ETL. Corak reka bentuk Extractor melaksanakan pembacaan serentak data dengan menggunakan goroutine dan saluran; corak reka bentuk Transformer melaksanakan logik pemprosesan data dengan menggunakan fungsi dan corak reka bentuk Loader melaksanakan penyimpanan data dengan menggunakan perpustakaan pihak ketiga. Ketiga-tiganya digabungkan dan bekerjasama antara satu sama lain untuk membina sistem pemprosesan data yang cekap dan boleh dipercayai.

Atas ialah kandungan terperinci Corak reka bentuk ETL dalam bahasa Go. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn