Rumah >pembangunan bahagian belakang >Golang >Golang melaksanakan sembang suara
Dengan kemajuan teknologi yang berterusan, komunikasi suara telah menjadi bahagian penting dalam kehidupan orang ramai Hari ini, sembang suara telah menjadi salah satu kaedah komunikasi yang paling biasa di Internet. Oleh itu, adalah perlu untuk menyepadukan fungsi sembang suara ke dalam aplikasi supaya pengguna boleh berkomunikasi dengan mudah melalui suara. Golang ialah bahasa pengaturcaraan yang sangat baik Ia cekap, pantas dan boleh dipercayai, jadi menggunakan golang untuk melaksanakan fungsi sembang suara akan menjadi pilihan yang sangat baik. Dalam artikel ini, kami akan memperkenalkan cara menggunakan golang untuk melaksanakan fungsi sembang suara.
1. Tetapan persekitaran
Sebelum mula melaksanakan fungsi sembang suara, anda perlu memasang persekitaran pembangunan bahasa golang pada komputer anda. Selepas pemasangan, anda perlu menggunakan arahan go get untuk memasang beberapa perpustakaan berkaitan suara, termasuk:
Pustaka ini boleh dipasang dengan cepat menggunakan arahan go get. Sebagai contoh, arahan go get github.com/gordonklaus/portaudio boleh memasang pustaka audio PortAudio.
2. Proses pelaksanaan
Selepas tetapan persekitaran selesai, langkah seterusnya ialah proses khusus untuk melaksanakan fungsi sembang suara. Pertama, anda perlu mencipta klien dan pelayan supaya pengguna boleh berkomunikasi antara satu sama lain. Selepas sambungan diwujudkan, pelanggan akan dapat menghantar data audio ke pelayan, yang akan menerimanya dan memajukannya kepada pelanggan lain. Kemudian, pelanggan lain boleh menerima data audio daripada pelanggan dan memainkannya.
Langkah pertama untuk mencipta pelayan ialah memulakan perkhidmatan HTTP dan membuat sambungan WebSocket, kodnya adalah seperti berikut:
func main() { // 1. 启动HTTP服务 http.HandleFunc("/", handleWebsocket) go http.ListenAndServe(":8080", nil) } func handleWebsocket(w http.ResponseWriter, r *http.Request) { // 2. 创建WebSocket连接 ws, err := websocket.Upgrade(w, r, nil, 1024, 1024) if err != nil { log.Fatal(err) } // 3. 处理音频数据传输 for { msgType, msg, err := ws.ReadMessage() if err != nil { log.Fatal(err) } ws.WriteMessage(msgType, msg) } }
dalam kod di atas, perkhidmatan HTTP mula-mula dimulakan dan didengari pada port 8080. Seterusnya, sambungan WebSocket dibuat dalam fungsi handleWebsocket, yang akan dipanggil setiap kali permintaan dihantar ke pelayan. Akhir sekali, untuk mengendalikan penghantaran data audio, beberapa operasi baca dan tulis WebSocket mudah digunakan.
Langkah pertama untuk mencipta klien adalah dengan menyertai pelayan, kodnya adalah seperti berikut:
func main() { // ...启动HTTP服务 // 1. 创建WebSocket连接 conn, _, err := websocket.DefaultDialer.Dial("ws://localhost:8080", nil) if err != nil { log.Fatal(err) } // 2. 加入服务器 message := []byte("join") conn.WriteMessage(websocket.TextMessage, message) // 3. 处理音频数据传输 for { _, message, err := conn.ReadMessage() if err != nil { log.Fatal(err) } // 处理接收到的音频数据 // ... } }
Dalam kod di atas , mula-mula buat sambungan WebSocket menggunakan fungsi DefaultDialer.Dial dan pautkannya ke pelayan. Seterusnya, pelanggan menggunakan mesej sertai mudah untuk memberitahu pelayan bahawa pelanggan telah menyertai bilik sembang. Akhirnya, pelanggan akan gelung untuk membaca data audio yang dihantar oleh pelayan dan memproses data.
Langkah seterusnya ialah langkah paling kritikal, rakam dan mainkan audio. Golang menggunakan perpustakaan audio bip untuk pemprosesan audio, yang menyediakan sejumlah besar pemproses audio dan kesan. Berikut ialah contoh kod cara merakam audio menggunakan pustaka:
func main() { // ...创建WebSocket连接并加入服务器 // 1. 配置recorder format := beep.Format{ SampleRate: 44100, //采样率 NumChannels: 1, //通道数 Precision: 2, //数据精度 } speaker.Init(format.SampleRate, format.SampleRate.N(time.Second/10)) streamer := &audioStreamer{} streamer.buf = new(bytes.Buffer) streamer.stream = beep.NewMixedStreamer(beep.StreamerFunc(streamer.Sample), beep.Callback(func() {})) resampler, err := resample.New(resample.SincMediumQuality, streamer.stream, streamer) // 2. 创建recorder stream, format, err := portaudio.OpenDefaultStream(1, 0, format.SampleRate, 0, resampler.Process) if err != nil { log.Fatal(err) } // 3. 启动recorder err = stream.Start() if err != nil { log.Fatal(err) } // 4. 启动播放器 speaker.Play(beep.Seq(streamer, beep.Callback(func() {}))) // 5. 处理音频数据传输 for { _, message, err := conn.ReadMessage() if err != nil { log.Fatal(err) } // 处理接收到的音频数据 // ... } } type audioStreamer struct { buf *bytes.Buffer stream beep.Streamer } func (a *audioStreamer) Stream(samples [][2]float64) (n int, ok bool) { d := make([]byte, len(samples)*4) if a.buf.Len() >= len(d) { a.buf.Read(d) ok = true } for i, s := range samples { s[0] = float64(int16(binary.LittleEndian.Uint16(d[i*4 : i*4+2]))) / 0x8000 } n = len(samples) return } func (a *audioStreamer) Err() error { return nil } func (a *audioStreamer) Sample(samples [][2]float64) (n int, ok bool) { n, ok = a.stream.Stream(samples) a.buf.Write(make([]byte, n*4)) for i, s := range samples[:n] { x := int16(s[0] * 0x8000) binary.LittleEndian.PutUint16(a.buf.Bytes()[i*4:i*4+2], uint16(x)) } return }
Dalam kod di atas, strim audio bip pertama kali dibuat dan strim input audio dibuat menggunakan perpustakaan portaudio, yang akan bermula dari lalai Dapatkan input audio daripada peranti input audio. Seterusnya, gunakan perpustakaan sampel semula untuk sampel semula data audio yang diperoleh daripada aliran input untuk menyesuaikan diri dengan kadar sampel audio yang digunakan semasa main semula. Akhir sekali, gunakan pustaka pembesar suara untuk memulakan pemain, yang akan menimbal dan memainkan data audio. Baca data audio dalam gelung dan tuliskannya ke strim audio menggunakan fungsi Sampel.
Seterusnya, anda akan menggunakan fungsi WriteMessage untuk menghantar data audio yang dirakam ke pelayan, dan membahagikan data kepada beberapa bahagian , setiap bahagian Dihantar kepada pelanggan lain masing-masing.
func main() { // ...录制音频并加入服务器 // 1. 将音频数据分包(长度为4096) packSize := 4096 maxPackCount := len(buf) / packSize for i := 0; i < maxPackCount+1; i++ { n := i * packSize l := min(len(buf)-n, packSize) if l > 0 { bufToWrite := buf[n : n+l] conn.WriteMessage(websocket.BinaryMessage, bufToWrite) } } } func min(a, b int) int { if a < b { return a } return b }
Dalam kod di atas, data audio dalam pembolehubah buf mula-mula dibahagikan kepada beberapa bahagian, setiap bahagian mempunyai panjang 4096. Kemudian, setiap bahagian data audio dihantar kepada pelanggan lain secara berasingan.
Pada ketika ini, program sembang suara mudah telah selesai. Walau bagaimanapun, jika anda ingin menjadikan program ini lebih lengkap dan stabil, penyahpepijatan dan ujian yang lebih terperinci diperlukan. Walau bagaimanapun, menggunakan golang untuk melaksanakan fungsi sembang suara adalah projek pembelajaran yang menarik dan patut dicuba, dan sampel kod di atas boleh memberikan beberapa rujukan asas untuk pemula.
Atas ialah kandungan terperinci Golang melaksanakan sembang suara. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!