search
HomeDatabaseMysql TutorialFFmpeg封装格式处理:视音频复用器(muxer)

打算记录一下基于FFmpeg的封装格式处理方面的例子。包括了视音频分离,复用,封装格式转换。这是第3篇。 本文记录一个基于FFmpeg的视音频复用器(Simplest FFmpeg muxer)。视音频复用器(Muxer)即是将视频压缩数据(例如H.264)和音频压缩数据(例如AAC)合

打算记录一下基于FFmpeg的封装格式处理方面的例子。包括了视音频分离,复用,封装格式转换。这是第3篇。

本文记录一个基于FFmpeg的视音频复用器(Simplest FFmpeg muxer)。视音频复用器(Muxer)即是将视频压缩数据(例如H.264)和音频压缩数据(例如AAC)合并到一个封装格式数据(例如MKV)中去。如图所示。在这个过程中并不涉及到编码和解码。

 

\

本文记录的程序将一个H.264编码的视频码流文件和一个MP3编码的音频码流文件,合成为一个MP4封装格式的文件。
,一共初始化了3个AVFormatContext,其中2个用于输入,1个用于输出。3个AVFormatContext初始化之后,通过avcodec_copy_context()函数可以将输入视频/音频的参数拷贝至输出视频/音频的AVCodecContext结构体。然后分别调用视频输入流和音频输入流的av_read_frame(),从视频输入流中取出视频的AVPacket,音频输入流中取出音频的AVPacket,分别将取出的AVPacket写入到输出文件中即可。其间用到了一个不太常见的函数av_compare_ts(),是比较时间戳用的。通过该函数可以决定该写入视频还是音频。

本文介绍的视音频复用器,输入的视频不一定是H.264裸流文件,音频也不一定是纯音频文件。可以选择两个封装过的视音频文件作为输入。程序会从视频输入文件中“挑”出视频流,音频输入文件中“挑”出音频流,再将“挑选”出来的视音频流复用起来。 PS1:对于某些封装格式(例如MP4/FLV/MKV等)中的H.264,需要用到名称为“h264_mp4toannexb”的bitstream filter。
PS2:对于某些封装格式(例如MP4/FLV/MKV等)中的AAC,需要用到名称为“aac_adtstoasc”的bitstream filter。

简单介绍一下流程中各个重要函数的意义:

avformat_open_input():打开输入文件。
avcodec_copy_context():赋值AVCodecContext的参数。
avformat_alloc_output_context2():初始化输出文件。
avio_open():打开输出文件。
avformat_write_header():写入文件头。
av_compare_ts():比较时间戳,决定写入视频还是写入音频。这个函数相对要少见一些。
av_read_frame():从输入文件读取一个AVPacket。
av_interleaved_write_frame():写入一个AVPacket到输出文件。
av_write_trailer():写入文件尾。

代码

下面贴上代码:
<strong>[cpp]</strong> view plaincopy
  1. /**
  2. * 最简单的基于FFmpeg的视音频复用器
  3. * Simplest FFmpeg Muxer
  4. *
  5. * 雷霄骅 Lei Xiaohua
  6. * leixiaohua1020@126.com
  7. * 中国传媒大学/数字电视技术
  8. * Communication University of China / Digital TV Technology
  9. * http://blog.csdn.net/leixiaohua1020
  10. *
  11. * 本程序可以将视频码流和音频码流打包到一种封装格式中。
  12. * 程序中将MP3编码的音频码流和H.264编码(MPEG2TS封装中)的视频码流打包成
  13. * MP4封装格式的文件。
  14. * 需要注意的是本程序并不改变视音频的编码格式。
  15. *
  16. * This software mux a video bitstream and a audio bitstream
  17. * together into a file.
  18. * In this example, it mux a H.264 bitstream (in MPEG2TS) and
  19. * a MP3 bitstream file together into MP4 format file.
  20. *
  21. */
  22. 
    
  23. #include <stdio.h></stdio.h>
  24. 
    
  25. extern "C"
  26. {
  27. #include "libavformat/avformat.h"
  28. };
  29. /*
  30. FIX: H.264 in some container format (FLV, MP4, MKV etc.) need
  31. "h264_mp4toannexb" bitstream filter (BSF)
  32. *Add SPS,PPS in front of IDR frame
  33. *Add start code ("0,0,0,1") in front of NALU
  34. H.264 in some container (MPEG2TS) don't need this BSF.
  35. */
  36. //'1': Use H.264 Bitstream Filter
  37. #define USE_H264BSF 0
  38. 
    
  39. /*
  40. FIX:AAC in some container format (FLV, MP4, MKV etc.) need
  41. "aac_adtstoasc" bitstream filter (BSF)
  42. */
  43. //'1': Use AAC Bitstream Filter
  44. #define USE_AACBSF 0
  45. 
    
  46. 
    
  47. 
    
  48. int main(int argc, char* argv[])
  49. {
  50. AVOutputFormat *ofmt = NULL;
  51. //输入对应一个AVFormatContext,输出对应一个AVFormatContext
  52. //(Input AVFormatContext and Output AVFormatContext)
  53. AVFormatContext *ifmt_ctx_v = NULL, *ifmt_ctx_a = NULL,*ofmt_ctx = NULL;
  54. AVPacket pkt;
  55. int ret, i;
  56. 
    
  57. char *in_filename_v = "cuc_ieschool.ts";//输入文件名(Input file URL)
  58. //char *in_filename_v = "cuc_ieschool.h264";
  59. //char *in_filename_a = "cuc_ieschool.mp3";
  60. //char *in_filename_a = "gowest.m4a";
  61. //char *in_filename_a = "gowest.aac";
  62. char *in_filename_a = "huoyuanjia.mp3";
  63. 
    
  64. char *out_filename = "cuc_ieschool.mp4";//输出文件名(Output file URL)
  65. av_register_all();
  66. //输入(Input)
  67. if ((ret = avformat_open_input(&ifmt_ctx_v, in_filename_v, 0, 0)) 
    
  68. printf( "Could not open input file.");
  69. goto end;
  70. }
  71. if ((ret = avformat_find_stream_info(ifmt_ctx_v, 0)) 
    
  72. printf( "Failed to retrieve input stream information");
  73. goto end;
  74. }
  75. 
    
  76. if ((ret = avformat_open_input(&ifmt_ctx_a, in_filename_a, 0, 0)) 
    
  77. printf( "Could not open input file.");
  78. goto end;
  79. }
  80. if ((ret = avformat_find_stream_info(ifmt_ctx_a, 0)) 
    
  81. printf( "Failed to retrieve input stream information");
  82. goto end;
  83. }
  84. printf("Input Information=====================\n");
  85. av_dump_format(ifmt_ctx_v, 0, in_filename_v, 0);
  86. av_dump_format(ifmt_ctx_a, 0, in_filename_a, 0);
  87. printf("======================================\n");
  88. //输出(Output)
  89. avformat_alloc_output_context2(&ofmt_ctx, NULL, NULL, out_filename);
  90. if (!ofmt_ctx) {
  91. printf( "Could not create output context\n");
  92. ret = AVERROR_UNKNOWN;
  93. goto end;
  94. }
  95. ofmt = ofmt_ctx->oformat;
  96. int videoindex_v=-1,videoindex_out=-1;
  97. for (i = 0; i nb_streams; i++) {
  98. //根据输入流创建输出流(Create output AVStream according to input AVStream)
  99. if(ifmt_ctx_v->streams[i]->codec->codec_type==AVMEDIA_TYPE_VIDEO){
  100. videoindex_v=i;
  101. AVStream *in_stream = ifmt_ctx_v->streams[i];
  102. AVStream *out_stream = avformat_new_stream(ofmt_ctx, in_stream->codec->codec);
  103. if (!out_stream) {
  104. printf( "Failed allocating output stream\n");
  105. ret = AVERROR_UNKNOWN;
  106. goto end;
  107. }
  108. videoindex_out=out_stream->index;
  109. //复制AVCodecContext的设置(Copy the settings of AVCodecContext)
  110. if (avcodec_copy_context(out_stream->codec, in_stream->codec) 
    
  111. printf( "Failed to copy context from input to output stream codec context\n");
  112. goto end;
  113. }
  114. out_stream->codec->codec_tag = 0;
  115. if (ofmt_ctx->oformat->flags & AVFMT_GLOBALHEADER)
  116. out_stream->codec->flags |= CODEC_FLAG_GLOBAL_HEADER;
  117. break;
  118. }
  119. }
  120. 
    
  121. int audioindex_a=-1,audioindex_out=-1;
  122. for (i = 0; i nb_streams; i++) {
  123. //根据输入流创建输出流(Create output AVStream according to input AVStream)
  124. if(ifmt_ctx_a->streams[i]->codec->codec_type==AVMEDIA_TYPE_AUDIO){
  125. audioindex_a=i;
  126. AVStream *in_stream = ifmt_ctx_a->streams[i];
  127. AVStream *out_stream = avformat_new_stream(ofmt_ctx, in_stream->codec->codec);
  128. if (!out_stream) {
  129. printf( "Failed allocating output stream\n");
  130. ret = AVERROR_UNKNOWN;
  131. goto end;
  132. }
  133. audioindex_out=out_stream->index;
  134. //复制AVCodecContext的设置(Copy the settings of AVCodecContext)
  135. if (avcodec_copy_context(out_stream->codec, in_stream->codec) 
    
  136. printf( "Failed to copy context from input to output stream codec context\n");
  137. goto end;
  138. }
  139. out_stream->codec->codec_tag = 0;
  140. if (ofmt_ctx->oformat->flags & AVFMT_GLOBALHEADER)
  141. out_stream->codec->flags |= CODEC_FLAG_GLOBAL_HEADER;
  142. 
    
  143. break;
  144. }
  145. }
  146. 
    
  147. //输出一下格式------------------
  148. printf("Output Information====================\n");
  149. av_dump_format(ofmt_ctx, 0, out_filename, 1);
  150. printf("======================================\n");
  151. //打开输出文件(Open output file)
  152. if (!(ofmt->flags & AVFMT_NOFILE)) {
  153. if (avio_open(&ofmt_ctx->pb, out_filename, AVIO_FLAG_WRITE) 
    
  154. printf( "Could not open output file '%s'", out_filename);
  155. goto end;
  156. }
  157. }
  158. //写文件头(Write file header)
  159. if (avformat_write_header(ofmt_ctx, NULL) 
    
  160. printf( "Error occurred when opening output file\n");
  161. goto end;
  162. }
  163. int frame_index=0;
  164. int64_t cur_pts_v=0,cur_pts_a=0;
  165. 
    
  166. //FIX
  167. #if USE_H264BSF
  168. AVBitStreamFilterContext* h264bsfc = av_bitstream_filter_init("h264_mp4toannexb");
  169. #endif
  170. #if USE_AACBSF
  171. AVBitStreamFilterContext* aacbsfc = av_bitstream_filter_init("aac_adtstoasc");
  172. #endif
  173. 
    
  174. while (1) {
  175. AVFormatContext *ifmt_ctx;
  176. int stream_index=0;
  177. AVStream *in_stream, *out_stream;
  178. 
    
  179. 
    
  180. //获取一个AVPacket(Get an AVPacket)
  181. if(av_compare_ts(cur_pts_v,ifmt_ctx_v->streams[videoindex_v]->time_base,cur_pts_a,ifmt_ctx_a->streams[audioindex_a]->time_base) 
    
  182. ifmt_ctx=ifmt_ctx_v;
  183. stream_index=videoindex_out;
  184. 
    
  185. if(av_read_frame(ifmt_ctx, &pkt) >= 0){
  186. do{
  187. if(pkt.stream_index==videoindex_v){
  188. cur_pts_v=pkt.pts;
  189. break;
  190. }
  191. }while(av_read_frame(ifmt_ctx, &pkt) >= 0);
  192. }else{
  193. break;
  194. }
  195. }else{
  196. ifmt_ctx=ifmt_ctx_a;
  197. stream_index=audioindex_out;
  198. if(av_read_frame(ifmt_ctx, &pkt) >= 0){
  199. do{
  200. if(pkt.stream_index==audioindex_a){
  201. cur_pts_a=pkt.pts;
  202. break;
  203. }
  204. }while(av_read_frame(ifmt_ctx, &pkt) >= 0);
  205. }else{
  206. break;
  207. }
  208. 
    
  209. }
  210. 
    
  211. in_stream = ifmt_ctx->streams[pkt.stream_index];
  212. out_stream = ofmt_ctx->streams[stream_index];
  213. //FIX
  214. #if USE_H264BSF
  215. av_bitstream_filter_filter(h264bsfc, in_stream->codec, NULL, &pkt.data, &pkt.size, pkt.data, pkt.size, 0);
  216. #endif
  217. #if USE_AACBSF
  218. av_bitstream_filter_filter(aacbsfc, in_stream->codec, NULL, &pkt.data, &pkt.size, pkt.data, pkt.size, 0);
  219. #endif
  220. //FIX:No PTS (Example: Raw H.264)
  221. //Simple Write PTS
  222. if(pkt.pts==AV_NOPTS_VALUE){
  223. //Write PTS
  224. AVRational time_base1=in_stream->time_base;
  225. //Duration between 2 frames (us)
  226. int64_t calc_duration=(double)AV_TIME_BASE/av_q2d(in_stream->r_frame_rate);
  227. //Parameters
  228. pkt.pts=(double)(frame_index*calc_duration)/(double)(av_q2d(time_base1)*AV_TIME_BASE);
  229. pkt.dts=pkt.pts;
  230. pkt.duration=(double)calc_duration/(double)(av_q2d(time_base1)*AV_TIME_BASE);
  231. frame_index++;
  232. }
  233. /* copy packet */
  234. //转换PTS/DTS(Convert PTS/DTS)
  235. pkt.pts = av_rescale_q_rnd(pkt.pts, in_stream->time_base, out_stream->time_base, (AVRounding)(AV_ROUND_NEAR_INF|AV_ROUND_PASS_MINMAX));
  236. pkt.dts = av_rescale_q_rnd(pkt.dts, in_stream->time_base, out_stream->time_base, (AVRounding)(AV_ROUND_NEAR_INF|AV_ROUND_PASS_MINMAX));
  237. pkt.duration = av_rescale_q(pkt.duration, in_stream->time_base, out_stream->time_base);
  238. pkt.pos = -1;
  239. pkt.stream_index=stream_index;
  240. 
    
  241. printf("Write 1 Packet. size:%5d\tpts:%8d\n",pkt.size,pkt.pts);
  242. //写入(Write)
  243. if (av_interleaved_write_frame(ofmt_ctx, &pkt) 
    
  244. printf( "Error muxing packet\n");
  245. break;
  246. }
  247. av_free_packet(&pkt);
  248. 
    
  249. }
  250. //写文件尾(Write file trailer)
  251. av_write_trailer(ofmt_ctx);
  252. 
    
  253. #if USE_H264BSF
  254. av_bitstream_filter_close(h264bsfc);
  255. #endif
  256. #if USE_AACBSF
  257. av_bitstream_filter_close(aacbsfc);
  258. #endif
  259. 
    
  260. end:
  261. avformat_close_input(&ifmt_ctx_v);
  262. avformat_close_input(&ifmt_ctx_a);
  263. /* close output */
  264. if (ofmt_ctx && !(ofmt->flags & AVFMT_NOFILE))
  265. avio_close(ofmt_ctx->pb);
  266. avformat_free_context(ofmt_ctx);
  267. if (ret 
    
  268. printf( "Error occurred.\n");
  269. return -1;
  270. }
  271. return 0;
Statement
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
Golang与FFmpeg: 如何实现音频混音和分离Golang与FFmpeg: 如何实现音频混音和分离Sep 27, 2023 pm 02:24 PM

Golang与FFmpeg:如何实现音频混音和分离,需要具体代码示例摘要:音频处理是许多多媒体应用程序中必不可少的一部分。在Golang中,我们可以使用FFmpeg库来实现音频的混音和分离。本文将介绍如何使用Golang调用FFmpeg库来实现音频混音和分离,并提供了具体的代码示例。通过学习本文,读者将了解到如何使用Golang和FFmpeg来实现音频处理

利用Golang和FFmpeg实现视频拼接的实践利用Golang和FFmpeg实现视频拼接的实践Sep 28, 2023 am 08:37 AM

利用Golang和FFmpeg实现视频拼接的实践引言:在日常生活中,我们经常会遇到需要将多个视频文件合并为一个的情况,例如将多段录制的视频拼接为一个完整的视频文件。为了实现这一目的,本文将介绍如何使用Golang和FFmpeg库来实现视频拼接的过程,并提供具体的代码示例。一、什么是Golang和FFmpeg?Golang(即Go语言)是一种开源的编程语言,由

Golang与FFmpeg: 如何实现音频合成和分割Golang与FFmpeg: 如何实现音频合成和分割Sep 27, 2023 pm 10:52 PM

Golang与FFmpeg:如何实现音频合成和分割,需要具体代码示例摘要:本文将介绍如何使用Golang和FFmpeg库来实现音频合成和分割。我们将用到一些具体的代码示例来帮助读者更好地理解。引言:随着音频处理技术的不断发展,音频合成和分割已经成为日常生活和工作中常见的功能需求。而Golang作为一种快速,高效且易于编写和维护的编程语言,加上FFmpeg作

如何在服务器上安装 PHP FFmpeg 扩展?如何在服务器上安装 PHP FFmpeg 扩展?Mar 28, 2024 pm 02:39 PM

如何在服务器上安装PHPFFmpeg扩展?在服务器上安装PHPFFmpeg扩展可以帮助我们在PHP项目中处理音视频文件,实现音视频文件的编解码、剪辑、处理等功能。本文将介绍如何在服务器上安装PHPFFmpeg扩展,以及具体的代码示例。首先,我们需要确保服务器上已经安装了PHP以及FFmpeg。如果没有安装FFmpeg,可以按照以下步骤安装FFmpe

利用Golang和FFmpeg实现视频去闪烁的实践利用Golang和FFmpeg实现视频去闪烁的实践Sep 27, 2023 pm 04:46 PM

利用Golang和FFmpeg实现视频去闪烁的实践概述:视频的闪烁问题是在视频处理过程中经常遇到的一个挑战。当录制视频的帧率与照明频率不匹配时,可能会导致视频中出现闪烁的情况。本文将介绍如何利用Golang和FFmpeg库来实现视频去闪烁的方法,并提供具体的代码示例。步骤:安装FFmpeg库:首先,我们需要在Golang开发环境中安装FFmpeg库。可以通过

Golang与FFmpeg: 如何实现音频格式转换和压缩Golang与FFmpeg: 如何实现音频格式转换和压缩Sep 28, 2023 pm 07:13 PM

Golang与FFmpeg:如何实现音频格式转换和压缩,需要具体代码示例引言:在音频文件处理中,有时会遇到需要转换音频格式或者压缩音频文件大小的需求。Golang作为一门强大的编程语言,结合FFmpeg这一流行的音视频处理工具,可以实现快速、高效的音频格式转换和压缩。本文将介绍如何利用Golang和FFmpeg来实现音频格式转换和压缩,并给出具体的代码示例

Golang与FFmpeg: 实现实时视频流分析与识别的技术Golang与FFmpeg: 实现实时视频流分析与识别的技术Sep 27, 2023 pm 02:31 PM

Golang与FFmpeg:实现实时视频流分析与识别的技术,需要具体代码示例引言:在当今数字化和智能化的时代,视频技术的应用越来越广泛。其中,实时视频流的分析与识别在安防监控、智能交通、人脸识别等领域发挥着重要作用。本文将介绍如何使用Golang和FFmpeg结合的技术实现实时视频流的分析与识别,并提供具体的代码示例。一、Golang介绍Golang是一种

PHP FFmpeg 扩展安装指南:简单易懂的教程PHP FFmpeg 扩展安装指南:简单易懂的教程Mar 28, 2024 pm 02:17 PM

PHPFFmpeg扩展安装指南:简单易懂的教程在网站开发的过程中,有时候我们需要处理各种多媒体文件,比如音频、视频等。而FFmpeg是一个功能强大的多媒体处理工具,它可以处理音频、视频等多种格式,并且支持各种转码、剪切等操作。PHPFFmpeg扩展则是在PHP中调用FFmpeg功能的扩展库,使用它可以很方便地处理多媒体文件。下面我们将详细介绍PHPF

See all articles

Hot AI Tools

Undresser.AI Undress

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress AI Tool

Undress images for free

Clothoff.io

Clothoff.io

AI clothes remover

AI Hentai Generator

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

Hot Tools

VSCode Windows 64-bit Download

VSCode Windows 64-bit Download

A free and powerful IDE editor launched by Microsoft

SublimeText3 Mac version

SublimeText3 Mac version

God-level code editing software (SublimeText3)

Zend Studio 13.0.1

Zend Studio 13.0.1

Powerful PHP integrated development environment

mPDF

mPDF

mPDF is a PHP library that can generate PDF files from UTF-8 encoded HTML. The original author, Ian Back, wrote mPDF to output PDF files "on the fly" from his website and handle different languages. It is slower than original scripts like HTML2FPDF and produces larger files when using Unicode fonts, but supports CSS styles etc. and has a lot of enhancements. Supports almost all languages, including RTL (Arabic and Hebrew) and CJK (Chinese, Japanese and Korean). Supports nested block-level elements (such as P, DIV),

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Integrate Eclipse with SAP NetWeaver application server.