>  기사  >  백엔드 개발  >  Golang은 음성 채팅을 구현합니다.

Golang은 음성 채팅을 구현합니다.

WBOY
WBOY원래의
2023-05-13 09:37:061086검색

기술의 지속적인 발전으로 음성 커뮤니케이션은 사람들의 삶에 없어서는 안될 부분이 되었습니다. 오늘날 음성 채팅은 인터넷에서 가장 일반적인 커뮤니케이션 방법 중 하나가 되었습니다. 따라서 사용자가 음성을 통해 쉽게 의사소통할 수 있도록 음성 채팅 기능을 애플리케이션에 통합하는 것이 필요합니다. Golang은 매우 뛰어난 프로그래밍 언어이며 효율적이고 빠르며 안정적이므로 golang을 사용하여 음성 채팅 기능을 구현하는 것은 매우 좋은 선택이 될 것입니다. 이번 글에서는 golang을 사용하여 음성채팅 기능을 구현하는 방법을 소개하겠습니다.

1. 환경 설정

음성 채팅 기능을 구현하기 전에 컴퓨터에 golang 언어 개발 환경을 설치해야 합니다. 설치 후 go get 명령을 사용하여 다음을 포함한 일부 음성 관련 라이브러리를 설치해야 합니다.

  1. github.com/gordonklaus/portaudio: PortAudio 오디오 라이브러리
  2. github.com/faiface/beep: 경고음 오디오 라이브러리
  3. github.com/faiface/gui: GUI 사용자 인터페이스 라이브러리
  4. github.com/gordonklaus/audiowaveform: 파형 파형 라이브러리

이러한 라이브러리를 빠르게 설치하려면 go get 명령을 사용하세요. 예를 들어 go get github.com/gordonklaus/portaudio 명령을 사용하면 PortAudio 오디오 라이브러리를 설치할 수 있습니다.

2. 구현 프로세스

환경 설정이 완료되면 다음 단계는 음성 채팅 기능을 구현하는 구체적인 프로세스입니다. 먼저, 사용자들이 서로 통신할 수 있도록 클라이언트와 서버를 생성해야 합니다. 연결이 설정된 후 클라이언트는 오디오 데이터를 서버로 보낼 수 있으며, 서버는 이를 수신하여 다른 클라이언트로 전달할 수 있습니다. 그러면 다른 클라이언트가 클라이언트로부터 오디오 데이터를 수신하여 재생할 수 있습니다.

  1. 서버 생성

서버 생성의 첫 번째 단계는 HTTP 서비스를 시작하고 WebSocket 연결을 생성하는 것입니다. 코드는 다음과 같습니다.

func main() {

    // 1. 启动HTTP服务
    http.HandleFunc("/", handleWebsocket)
    go http.ListenAndServe(":8080", nil)
    
}

func handleWebsocket(w http.ResponseWriter, r *http.Request) {

    // 2. 创建WebSocket连接
    ws, err := websocket.Upgrade(w, r, nil, 1024, 1024)
    if err != nil {
        log.Fatal(err)
    }
    
    // 3. 处理音频数据传输
    for {
        msgType, msg, err := ws.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        ws.WriteMessage(msgType, msg)
    }
    
}

위 코드에서 HTTP 서비스가 먼저 시작되고 수신됩니다. 포트의 8080에 있습니다. 다음으로, 요청이 서버로 전송될 때마다 호출되는 WebSocket 연결이 HandleWebsocket 함수에서 생성됩니다. 마지막으로 오디오 데이터 전송을 처리하기 위해 몇 가지 간단한 WebSocket 읽기 및 쓰기 작업이 사용됩니다.

  1. 클라이언트 만들기

클라이언트를 만드는 첫 번째 단계는 서버에 가입하는 것입니다. 코드는 다음과 같습니다.

func main() {

    // ...启动HTTP服务

    // 1. 创建WebSocket连接
    conn, _, err := websocket.DefaultDialer.Dial("ws://localhost:8080", nil)
    if err != nil {
        log.Fatal(err)
    }

    // 2. 加入服务器
    message := []byte("join")
    conn.WriteMessage(websocket.TextMessage, message)

    // 3. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}

위 코드에서 먼저 DefaultDialer.Dial 함수를 사용하여 WebSocket 연결을 만들고 연결합니다. 서버에 연결합니다. 다음으로 클라이언트는 간단한 참여 메시지를 사용하여 클라이언트가 채팅방에 참여했음을 서버에 알립니다. 마지막으로 클라이언트는 서버에서 보낸 오디오 데이터를 읽고 데이터를 처리하기 위해 반복합니다.

  1. 오디오 녹음 및 재생

다음 단계는 가장 중요한 단계인 오디오 녹음 및 재생입니다. Golang은 오디오 처리를 위해 수많은 오디오 프로세서와 효과를 제공하는 경고음 오디오 라이브러리를 사용합니다. 다음은 라이브러리를 사용하여 오디오를 녹음하는 방법에 대한 코드 예제입니다.

func main() {

    // ...创建WebSocket连接并加入服务器

    // 1. 配置recorder
    format := beep.Format{
        SampleRate:  44100, //采样率
        NumChannels: 1,     //通道数
        Precision:   2,     //数据精度
    }
    speaker.Init(format.SampleRate, format.SampleRate.N(time.Second/10))

    streamer := &audioStreamer{}
    streamer.buf = new(bytes.Buffer)
    streamer.stream = beep.NewMixedStreamer(beep.StreamerFunc(streamer.Sample), beep.Callback(func() {}))

    resampler, err := resample.New(resample.SincMediumQuality, streamer.stream, streamer)

    // 2. 创建recorder
    stream, format, err := portaudio.OpenDefaultStream(1, 0, format.SampleRate, 0, resampler.Process)

    if err != nil {
        log.Fatal(err)
    }

    // 3. 启动recorder
    err = stream.Start()
    if err != nil {
        log.Fatal(err)
    }

    // 4. 启动播放器
    speaker.Play(beep.Seq(streamer, beep.Callback(func() {})))

    // 5. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}

type audioStreamer struct {
    buf    *bytes.Buffer
    stream beep.Streamer
}

func (a *audioStreamer) Stream(samples [][2]float64) (n int, ok bool) {
    d := make([]byte, len(samples)*4)
    if a.buf.Len() >= len(d) {
        a.buf.Read(d)
        ok = true
    }

    for i, s := range samples {
        s[0] = float64(int16(binary.LittleEndian.Uint16(d[i*4 : i*4+2]))) / 0x8000
    }
    n = len(samples)
    return
}

func (a *audioStreamer) Err() error {
    return nil
}

func (a *audioStreamer) Sample(samples [][2]float64) (n int, ok bool) {
    n, ok = a.stream.Stream(samples)
    a.buf.Write(make([]byte, n*4))
    for i, s := range samples[:n] {
        x := int16(s[0] * 0x8000)
        binary.LittleEndian.PutUint16(a.buf.Bytes()[i*4:i*4+2], uint16(x))
    }
    return
}

위 코드에서 경고음 오디오 스트림이 먼저 생성되고 오디오 입력 스트림이 portaudio 라이브러리를 사용하여 생성됩니다. 이 스트림은 기본 오디오 입력에서 가져옵니다. 장치 오디오 입력을 받습니다. 다음으로, 재생 중에 사용되는 오디오 샘플 속도에 맞게 리샘플 라이브러리를 사용하여 입력 스트림에서 얻은 오디오 데이터를 리샘플링합니다. 마지막으로 스피커 라이브러리를 사용하여 오디오 데이터를 버퍼링하고 재생하는 플레이어를 시작합니다. 루프에서 오디오 데이터를 읽고 Sample 함수를 사용하여 오디오 스트림에 씁니다.

  1. 오디오 데이터를 서버로 보내기

다음으로 WriteMessage 함수를 사용하여 녹음된 오디오 데이터를 서버로 보내고, 데이터를 여러 부분으로 나누고, 각 부분을 다른 클라이언트로 보냅니다.

func main() {

    // ...录制音频并加入服务器

    // 1. 将音频数据分包(长度为4096)
    packSize := 4096
    maxPackCount := len(buf) / packSize
    for i := 0; i < maxPackCount+1; i++ {
        n := i * packSize
        l := min(len(buf)-n, packSize)
        if l > 0 {
            bufToWrite := buf[n : n+l]
            conn.WriteMessage(websocket.BinaryMessage, bufToWrite)
        }
    }

}

func min(a, b int) int {
    if a < b {
        return a
    }
    return b
}

위 코드에서 먼저 buf 변수의 오디오 데이터를 여러 부분으로 나누고, 각 부분의 길이는 4096입니다. 그런 다음 각 오디오 데이터 조각이 다른 클라이언트에 별도로 전송됩니다.

이제 간단한 음성채팅 프로그램이 완성되었습니다. 그러나 이 프로그램을 더욱 완전하고 안정적으로 만들고 싶다면 보다 자세한 디버깅과 테스트가 필요합니다. 그러나 golang을 사용하여 음성 채팅 기능을 구현하는 것은 흥미롭고 시도해 볼 가치가 있는 학습 프로젝트이며, 위의 코드 샘플은 초보자에게 몇 가지 기본적인 참고 자료를 제공할 수 있습니다.

위 내용은 Golang은 음성 채팅을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.