>백엔드 개발 >Golang >Golang 및 FFmpeg: 비디오 프레임 가로채기 및 크기 조정 구현 방법

Golang 및 FFmpeg: 비디오 프레임 가로채기 및 크기 조정 구현 방법

WBOY
WBOY원래의
2023-09-27 09:34:431519검색

Golang与FFmpeg: 如何实现视频帧截取和缩放

Golang 및 FFmpeg: 비디오 프레임 가로채기 및 크기 조정을 구현하는 방법, 구체적인 코드 예제가 필요합니다.

개요:
비디오 처리 요구 사항이 증가함에 따라 사람들은 Golang을 비디오 처리용 프로그래밍 언어로 사용하려는 경향이 점점 더 커지고 있습니다. 업계에서 가장 널리 사용되는 오픈 소스 멀티미디어 처리 프레임워크인 FFmpeg는 오디오 및 비디오 데이터를 처리하는 풍부한 기능을 제공합니다. 이 기사에서는 Golang을 사용하여 FFmpeg를 호출하여 비디오 프레임 가로채기 및 크기 조정 기능을 구현하는 방법을 소개하고 해당 코드 예제를 제공합니다.

전제 조건:
시작하기 전에 FFmpeg가 컴퓨터에 설치되어 있고 올바른 환경 변수가 구성되어 있는지 확인해야 합니다.

비디오 프레임 가로채기:
먼저, 비디오 프레임 가로채기를 구현하는 방법을 살펴보겠습니다. FFmpeg에서는 "avformat" 모듈을 사용하여 비디오 파일을 읽고 "avcodec" 모듈을 사용하여 비디오 프레임을 디코딩할 수 있습니다. 다음은 간단한 샘플 코드입니다.

package main

import (
    "fmt"
    "log"

    "github.com/giorgisio/goav/avcodec"
    "github.com/giorgisio/goav/avformat"
)

func main() {
    // 打开视频文件
    formatContext := avformat.AvformatAllocContext()
    if err := avformat.AvformatOpenInput(&formatContext, "/path/to/video.mp4", nil, nil); err != nil {
        log.Fatal("无法打开视频文件:", err)
    }
    defer avformat.AvformatFreeContext(formatContext)

    // 查找视频流
    if err := formatContext.AvformatFindStreamInfo(nil); err != nil {
        log.Fatal("无法查找视频流:", err)
    }

    var videoStreamIndex int32 = -1
    for i, stream := range formatContext.Streams() {
        if stream.CodecParameters().CodecType() == avformat.AVMEDIA_TYPE_VIDEO {
            videoStreamIndex = int32(i)
            break
        }
    }

    if videoStreamIndex == -1 {
        log.Fatal("找不到视频流")
    }

    // 找到视频解码器
    videoDecoder := avcodec.AvcodecFindDecoder(avcodec.CodecId(formatContext.Streams()[videoStreamIndex].CodecParameters().CodecId()))
    if videoDecoder == nil {
        log.Fatal("无法找到视频解码器")
    }

    // 打开解码器上下文
    videoCodecContext := avcodec.AvcodecAllocContext3(videoDecoder)
    if err := avcodec.AvcodecParametersToContext(videoCodecContext, formatContext.Streams()[videoStreamIndex].CodecParameters()); err != nil {
        log.Fatal("无法打开解码器上下文:", err)
    }

    if err := videoCodecContext.AvcodecOpen2(videoDecoder, nil); err != nil {
        log.Fatal("无法打开解码器:", err)
    }
    defer avcodec.AvcodecFreeContext(videoCodecContext)

    // 读取视频帧
    packet := avcodec.AvPacketAlloc()
    defer avcodec.AvPacketFree(packet)

    for formatContext.AvReadFrame(packet) >= 0 {
        if packet.StreamIndex() == videoStreamIndex {
            frame := avutil.AvFrameAlloc()
            defer avutil.AvFrameFree(frame)

            if err := videoCodecContext.AvcodecSendPacket(packet); err == nil {
                for videoCodecContext.AvcodecReceiveFrame(frame) == nil {
                    // 处理视频帧
                    fmt.Printf("视频帧:%d
", frame.Pts())
                }
            }
        }
    }
}

위 코드에서는 먼저 avformat.AvformatAllocContext()를 사용하여 형식 컨텍스트 개체를 할당하고 avformat.AvformatOpenInput()을 사용합니다. code >동영상 파일이 열립니다. 그런 다음 avformat.AvformatFindStreamInfo()를 사용하여 비디오 스트림을 찾은 다음 avformat.AVMEDIA_TYPE_VIDEO를 사용하여 비디오 스트림인지 확인합니다. avformat.AvformatAllocContext()来分配一个格式上下文对象,并使用avformat.AvformatOpenInput()打开了一个视频文件。然后,我们使用avformat.AvformatFindStreamInfo()找到了视频流,再使用avformat.AVMEDIA_TYPE_VIDEO来判断是否为视频流。

接下来,我们使用avcodec.AvcodecFindDecoder()来查找适合的解码器,并使用avcodec.AvcodecParametersToContext()avcodec.AvcodecOpen2()打开了解码器上下文。

最后,我们使用formatContext.AvReadFrame()来读取视频帧,并在videoCodecContext.AvcodecReceiveFrame()中处理每一帧。在这个示例中,我们只是简单地打印每一帧的PTS值。

视频缩放:
接下来,我们来看一下如何实现视频帧的缩放。在FFmpeg中,可以使用"swscale"模块来进行视频帧的缩放。以下是一个简单的示例代码:

package main

import (
    "fmt"
    "image"
    "log"
    "os"

    "github.com/giorgisio/goav/avcodec"
    "github.com/giorgisio/goav/avformat"
    "github.com/giorgisio/goav/swscale"
    "github.com/nfnt/resize"
)

func main() {
    // 打开视频文件
    formatContext := avformat.AvformatAllocContext()
    if err := avformat.AvformatOpenInput(&formatContext, "/path/to/video.mp4", nil, nil); err != nil {
        log.Fatal("无法打开视频文件:", err)
    }
    defer avformat.AvformatFreeContext(formatContext)

    // 查找视频流
    if err := formatContext.AvformatFindStreamInfo(nil); err != nil {
        log.Fatal("无法查找视频流:", err)
    }

    var videoStreamIndex int32 = -1
    for i, stream := range formatContext.Streams() {
        if stream.CodecParameters().CodecType() == avformat.AVMEDIA_TYPE_VIDEO {
            videoStreamIndex = int32(i)
            break
        }
    }

    if videoStreamIndex == -1 {
        log.Fatal("找不到视频流")
    }

    // 找到视频解码器
    videoDecoder := avcodec.AvcodecFindDecoder(avcodec.CodecId(formatContext.Streams()[videoStreamIndex].CodecParameters().CodecId()))
    if videoDecoder == nil {
        log.Fatal("无法找到视频解码器")
    }

    // 打开解码器上下文
    videoCodecContext := avcodec.AvcodecAllocContext3(videoDecoder)
    if err := avcodec.AvcodecParametersToContext(videoCodecContext, formatContext.Streams()[videoStreamIndex].CodecParameters()); err != nil {
        log.Fatal("无法打开解码器上下文:", err)
    }

    if err := videoCodecContext.AvcodecOpen2(videoDecoder, nil); err != nil {
        log.Fatal("无法打开解码器:", err)
    }
    defer avcodec.AvcodecFreeContext(videoCodecContext)

    // 创建视频缩放上下文
    swscaleContext := swscale.SwsGetContext(
        videoCodecContext.Width(), videoCodecContext.Height(), videoCodecContext.PixFmt(),
        videoCodecContext.Width()/2, videoCodecContext.Height()/2, avcodec.AV_PIX_FMT_RGB24,
        0, nil, nil, nil,
    )
    defer swscale.SwsFreeContext(swscaleContext)

    // 创建输出视频文件
    outfile, err := os.Create("/path/to/output.mp4")
    if err != nil {
        log.Fatal("无法创建输出视频文件:", err)
    }
    defer outfile.Close()

    // 创建视频编码器
    videoEncoder := avcodec.AvcodecFindEncoder(avcodec.AV_CODEC_ID_MPEG4)
    if videoEncoder == nil {
        log.Fatal("无法找到视频编码器")
    }

    // 创建编码器上下文
    videoCodecCtx := avcodec.AvcodecAllocContext3(videoEncoder)
    videoCodecCtx.SetBitRate(400000)
    videoCodecCtx.SetWidth(videoCodecContext.Width() / 2)
    videoCodecCtx.SetHeight(videoCodecContext.Height() / 2)
    videoCodecCtx.SetTimeBase(avformat.AVR{Num: 1, Den: 25})
    videoCodecCtx.SetPixFmt(avcodec.AV_PIX_FMT_YUV420P)

    // 打开编码器上下文
    if err := videoCodecCtx.AvcodecOpen2(videoEncoder, nil); err != nil {
        log.Fatal("无法打开编码器上下文:", err)
    }
    defer avcodec.AvcodecFreeContext(videoCodecCtx)

    // 写入视频文件头
    formatContext.SetOutput(outfile)
    if err := formatContext.AvformatWriteHeader(nil); err != nil {
        log.Fatal("无法写入视频文件头:", err)
    }
    defer formatContext.AvformatFreeOutputContext()

    // 准备编码帧和缩放帧
    encodeFrame := avutil.AvFrameAlloc()
    defer avutil.AvFrameFree(encodeFrame)

    encodeFrame.SetWidth(videoCodecCtx.Width())
    encodeFrame.SetHeight(videoCodecCtx.Height())
    encodeFrame.SetFormat(int32(videoCodecCtx.PixFmt()))

    frameSize := avcodec.AvpixelAvImageGetBufferSize(avcodec.AV_PIX_FMT_RGB24, videoCodecCtx.Width()/2, videoCodecCtx.Height()/2, 1)
    encodeFrameBuffer := avutil.AvMalloc(frameSize)
    defer avutil.AvFree(encodeFrameBuffer)

    encodeFrame.AvpixelAvImageFillArrays(encodeFrameBuffer, 1)

    for formatContext.AvReadFrame(packet) >= 0 {
        if packet.StreamIndex() == videoStreamIndex {
            frame := avutil.AvFrameAlloc()
            defer avutil.AvFrameFree(frame)

            if err := videoCodecContext.AvcodecSendPacket(packet); err != nil {
                log.Fatal("无法发送视频包:", err)
            }

            for videoCodecContext.AvcodecReceiveFrame(frame) == nil {
                // 缩放视频帧
                swscale.SwsScale(
                    swscaleContext,
                    frame.Data(), frame.Linesize(),
                    0, frame.Height(),
                    encodeFrame.Data(), encodeFrame.Linesize(),
                )

                // 编码视频帧
                encodeFrame.SetPts(frame.Pts())
                packet := avcodec.AvPacketAlloc()
                if err := avcodec.AvcodecSendFrame(videoCodecCtx, encodeFrame); err != nil {
                    log.Fatal("无法发送编码帧:", err)
                }

                if err := avcodec.AvcodecReceivePacket(videoCodecCtx, packet); err != nil {
                    log.Fatal("无法接收编码包:", err)
                }
                defer avcodec.AvPacketFree(packet)

                // 写入编码后的帧到文件
                if err := formatContext.AvWriteFrame(packet); err != nil {
                    log.Fatal("无法写入帧到文件:", err)
                }
            }
        }
    }

    // 写入视频文件尾
    if err := formatContext.AvWriteTrailer(); err != nil {
        log.Fatal("无法写入视频文件尾:", err)
    }
}

以上代码中,我们创建了一个视频缩放上下文swscaleContext,它的输入是原始视频帧的大小,输出是缩放后的视频帧的大小。我们还创建了一个新的编码器上下文videoCodecCtx,它的大小为原始视频帧大小的一半,并将其设置为YUV420P像素格式。

在读取到每一帧视频后,我们使用swscale.SwsScale()

다음으로 avcodec.AvcodecFindDecoder()를 사용하여 적합한 디코더를 찾고 avcodec.AvcodecParametersToContext()avcodec.AvcodecOpen2() 디코더 컨텍스트를 엽니다. <p><br>마지막으로 <code>formatContext.AvReadFrame()을 사용하여 비디오 프레임을 읽고 videoCodecContext.AvcodecReceiveFrame()에서 각 프레임을 처리합니다. 이 예에서는 단순히 각 프레임의 PTS 값을 인쇄합니다.

🎜비디오 스케일링: 🎜다음으로 비디오 프레임 스케일링을 달성하는 방법을 살펴보겠습니다. FFmpeg에서는 "swscale" 모듈을 사용하여 비디오 프레임의 크기를 조정할 수 있습니다. 다음은 간단한 샘플 코드입니다. 🎜rrreee🎜위 코드에서는 비디오 스케일링 컨텍스트 swscaleContext를 생성합니다. 이 컨텍스트의 입력은 원본 비디오 프레임의 크기이고 출력은 swscaleContext의 크기입니다. 확장된 비디오 프레임. 또한 원본 비디오 프레임 크기의 절반인 새로운 인코더 컨텍스트 videoCodecCtx를 생성하고 이를 YUV420P 픽셀 형식으로 설정합니다. 🎜🎜비디오의 각 프레임을 읽은 후 swscale.SwsScale() 함수를 사용하여 지정된 크기로 크기를 조정하고 크기가 조정된 비디오 프레임을 인코더로 전송하여 인코딩합니다. 그런 다음 인코딩된 프레임을 출력 비디오 파일에 씁니다. 🎜🎜요약: 🎜Golang과 FFmpeg의 결합은 개발자에게 강력한 비디오 처리 도구를 제공합니다. 이 기사에서는 Golang을 사용하여 FFmpeg를 호출하여 비디오 프레임 가로채기 및 크기 조정 기능을 구현하는 방법을 소개하고 해당 코드 예제를 제공합니다. 이 예제가 Golang 및 FFmpeg를 사용하여 비디오 데이터를 처리하는 방법을 더 잘 이해하는 데 도움이 되기를 바랍니다. 🎜

위 내용은 Golang 및 FFmpeg: 비디오 프레임 가로채기 및 크기 조정 구현 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.