Maison >développement back-end >Golang >Golang implémente le chat vocal

Golang implémente le chat vocal

WBOY
WBOYoriginal
2023-05-13 09:37:061159parcourir

Avec les progrès continus de la technologie, la communication vocale est devenue un élément indispensable de la vie des gens. Aujourd'hui, le chat vocal est devenu l'une des méthodes de communication les plus courantes sur Internet. Par conséquent, il est nécessaire d’intégrer la fonctionnalité de chat vocal dans l’application afin que les utilisateurs puissent facilement communiquer par la voix. Golang est un très excellent langage de programmation. Il est efficace, rapide et fiable, donc utiliser Golang pour implémenter la fonction de chat vocal sera un très bon choix. Dans cet article, nous présenterons comment utiliser Golang pour implémenter la fonction de chat vocal.

1. Paramètres d'environnement

Avant de commencer à implémenter la fonction de chat vocal, vous devez installer l'environnement de développement du langage Golang sur votre ordinateur. Après l'installation, vous devez utiliser la commande go get pour installer certaines bibliothèques liées à la voix, notamment :

  1. github.com/gordonklaus/portaudio : bibliothèque audio PortAudio
  2. github.com/faiface/beep : bibliothèque audio bip
  3. github.com/faiface/gui : bibliothèque d'interface utilisateur GUI
  4. github.com/gordonklaus/audiowaveform : bibliothèque de formes d'onde Waveform

Utilisez la commande go get pour installer rapidement ces bibliothèques. Par exemple, la commande go get github.com/gordonklaus/portaudio peut installer la bibliothèque audio PortAudio.

2. Processus de mise en œuvre

Une fois le paramétrage de l'environnement terminé, l'étape suivante est le processus spécifique de mise en œuvre de la fonction de chat vocal. Tout d’abord, vous devez créer un client et un serveur afin que les utilisateurs puissent communiquer entre eux. Une fois la connexion établie, le client pourra envoyer des données audio au serveur, qui les recevra et les transmettra aux autres clients. Ensuite, d'autres clients peuvent recevoir les données audio du client et les lire.

  1. Création d'un serveur

La première étape de la création d'un serveur consiste à démarrer le service HTTP et à créer une connexion WebSocket. Le code est le suivant :

func main() {

    // 1. 启动HTTP服务
    http.HandleFunc("/", handleWebsocket)
    go http.ListenAndServe(":8080", nil)
    
}

func handleWebsocket(w http.ResponseWriter, r *http.Request) {

    // 2. 创建WebSocket连接
    ws, err := websocket.Upgrade(w, r, nil, 1024, 1024)
    if err != nil {
        log.Fatal(err)
    }
    
    // 3. 处理音频数据传输
    for {
        msgType, msg, err := ws.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        ws.WriteMessage(msgType, msg)
    }
    
}

Dans le code ci-dessus, un service HTTP est d'abord démarré et écoute. sur 8080 sur le port. Ensuite, une connexion WebSocket est créée dans la fonction handleWebsocket, qui sera appelée à chaque fois qu'une requête est envoyée au serveur. Enfin, pour gérer la transmission des données audio, quelques opérations simples de lecture et d'écriture WebSocket sont utilisées.

  1. Créer un client

La première étape pour créer un client est de rejoindre le serveur, le code est le suivant :

func main() {

    // ...启动HTTP服务

    // 1. 创建WebSocket连接
    conn, _, err := websocket.DefaultDialer.Dial("ws://localhost:8080", nil)
    if err != nil {
        log.Fatal(err)
    }

    // 2. 加入服务器
    message := []byte("join")
    conn.WriteMessage(websocket.TextMessage, message)

    // 3. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}

Dans le code ci-dessus, utilisez d'abord la fonction DefaultDialer.Dial pour créer une connexion WebSocket et vous connecter il Lien vers le serveur. Ensuite, le client utilise un simple message de participation pour indiquer au serveur qu'il a rejoint la salle de discussion. Enfin, le client bouclera pour lire les données audio envoyées par le serveur et traiter les données.

  1. Enregistrer et lire de l'audio

L'étape suivante est l'étape la plus critique : enregistrer et lire de l'audio. Golang utilise la bibliothèque audio beep pour le traitement audio, qui fournit un grand nombre de processeurs et d'effets audio. Voici un exemple de code montrant comment enregistrer de l'audio à l'aide de la bibliothèque :

func main() {

    // ...创建WebSocket连接并加入服务器

    // 1. 配置recorder
    format := beep.Format{
        SampleRate:  44100, //采样率
        NumChannels: 1,     //通道数
        Precision:   2,     //数据精度
    }
    speaker.Init(format.SampleRate, format.SampleRate.N(time.Second/10))

    streamer := &audioStreamer{}
    streamer.buf = new(bytes.Buffer)
    streamer.stream = beep.NewMixedStreamer(beep.StreamerFunc(streamer.Sample), beep.Callback(func() {}))

    resampler, err := resample.New(resample.SincMediumQuality, streamer.stream, streamer)

    // 2. 创建recorder
    stream, format, err := portaudio.OpenDefaultStream(1, 0, format.SampleRate, 0, resampler.Process)

    if err != nil {
        log.Fatal(err)
    }

    // 3. 启动recorder
    err = stream.Start()
    if err != nil {
        log.Fatal(err)
    }

    // 4. 启动播放器
    speaker.Play(beep.Seq(streamer, beep.Callback(func() {})))

    // 5. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}

type audioStreamer struct {
    buf    *bytes.Buffer
    stream beep.Streamer
}

func (a *audioStreamer) Stream(samples [][2]float64) (n int, ok bool) {
    d := make([]byte, len(samples)*4)
    if a.buf.Len() >= len(d) {
        a.buf.Read(d)
        ok = true
    }

    for i, s := range samples {
        s[0] = float64(int16(binary.LittleEndian.Uint16(d[i*4 : i*4+2]))) / 0x8000
    }
    n = len(samples)
    return
}

func (a *audioStreamer) Err() error {
    return nil
}

func (a *audioStreamer) Sample(samples [][2]float64) (n int, ok bool) {
    n, ok = a.stream.Stream(samples)
    a.buf.Write(make([]byte, n*4))
    for i, s := range samples[:n] {
        x := int16(s[0] * 0x8000)
        binary.LittleEndian.PutUint16(a.buf.Bytes()[i*4:i*4+2], uint16(x))
    }
    return
}

Dans le code ci-dessus, un flux audio bip est d'abord créé et un flux d'entrée audio est créé à l'aide de la bibliothèque portaudio, qui sera extrait de l'entrée audio par défaut. périphérique Obtenez une entrée audio. Ensuite, utilisez la bibliothèque de rééchantillonnage pour rééchantillonner les données audio obtenues à partir du flux d'entrée afin de les adapter à la fréquence d'échantillonnage audio utilisée pendant la lecture. Enfin, utilisez la bibliothèque de haut-parleurs pour démarrer le lecteur, qui mettra en mémoire tampon et lira les données audio. Lisez les données audio en boucle et écrivez-les dans le flux audio à l'aide de la fonction Sample.

  1. Envoyer des données audio au serveur

Ensuite, vous utiliserez la fonction WriteMessage pour envoyer les données audio enregistrées au serveur, diviser les données en plusieurs parties et envoyer chaque partie à d'autres clients.

func main() {

    // ...录制音频并加入服务器

    // 1. 将音频数据分包(长度为4096)
    packSize := 4096
    maxPackCount := len(buf) / packSize
    for i := 0; i < maxPackCount+1; i++ {
        n := i * packSize
        l := min(len(buf)-n, packSize)
        if l > 0 {
            bufToWrite := buf[n : n+l]
            conn.WriteMessage(websocket.BinaryMessage, bufToWrite)
        }
    }

}

func min(a, b int) int {
    if a < b {
        return a
    }
    return b
}

Dans le code ci-dessus, divisez d'abord les données audio de la variable buf en plusieurs parties, et la longueur de chaque partie est de 4096. Ensuite, chaque élément de données audio est envoyé séparément aux autres clients.

À ce stade, un simple programme de chat vocal a été complété. Cependant, si vous souhaitez rendre ce programme plus complet et plus stable, un débogage et des tests plus détaillés sont nécessaires. Cependant, utiliser Golang pour implémenter la fonction de chat vocal est un projet d'apprentissage intéressant et qui vaut la peine d'être essayé, et l'exemple de code ci-dessus peut fournir une référence de base pour les débutants.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Le Golang est-il gratuit ?Article suivant:Le Golang est-il gratuit ?