首頁 >資料庫 >mysql教程 >常用的ITU Speech Codec大全（G.711,G.722.1,G.722.2,G.723.1,G.

常用的ITU Speech Codec大全（G.711,G.722.1,G.722.2,G.723.1,G.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB原創: 2016-06-07 15:42:431934瀏覽

总结了常用的ITU Speech Codec，谨供大家学习参考： 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型：压扩PCM 编码速率：64Kbps 理论延时：处理一个样点的时间（1/8000秒=0.125毫秒）；音质：长途质量；优点：算法复杂度低，压缩

总结了常用的ITU Speech Codec，谨供大家学习参考：

1、G.711: Pulse code modulation (PCM) of voice frequencies

编码类型：压扩PCM
编码速率：64Kbps

理论延时：处理一个样点的时间（1/8000秒=0.125毫秒）；

音质：长途质量；
优点：算法复杂度低，压缩比小（CD音质>400kbps），编解码延时最短（相对其它技术）
缺点：占用的带宽较高
应用领域：voip，PSTN 电话网络
版税方式：Free
备注：

70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

G.711是最基本的一种编码方法，俗称PCM，采用μ-law（主要北美地区使用）和A-law（其它地区）两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单，很多ADC硬件的输入输出就直接支持PCM格式；另一方面PCM格式在通信系统中往往需要进一步压缩，因此它是其它语音编码算法的输入源。

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型：变换域Audio coding
编码速率：24Kbps、32Kbps;（其实可以实现更多码率，以8kbps递增码率，另外还有32kHz采样的更高码率版本）；

理论延时：40ms（20ms frame size + 20ms lookhead）

音质：低码率时优于MP3、WMA等音频算法，详细可参考Polycom网站；
优点：算法复杂度低，小于 5.5wMOPS，相对于MP3，WMA等算法在低码率时音质要好；

缺点：对于speech而言，音质没有CELP模型编码器响亮；另外，48kbps以上音质变化不大；
应用领域：电视会议、电话会议和互联网流应用；
版税方式：Free
备注：

G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法，主要采用了变换域编码方法，因此可以对语音（300~4000Hz）和7kHz以内的音乐进行编码，采样率为16kHz，其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中，本算法在低码率时其音质要高于MP3等音频算法，再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后，它的附录C中提供了32kHz采样的14k带宽的音频编码方案，进一步提高了音质。

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型：ACELP
编码速率：6.6Kbps~23.85Kbps;

理论延时：25ms（20ms frame size + 1/4 subframe size）

音质：高质量相对于窄带语音；
优点：高质量、多码率处理和自适应特性；

缺点：复杂度太高；
应用领域：3GPP 无线通信；
版税方式：单一授权
备注：

AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此，它也是宽频语音应用的理想编解码器，因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准，并且，在具备宽频语音（采样频率 16 kHz）支持的情况下，它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器，这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频，等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型：ACELP、MP-MLQ
编码速率：5.3Kbps、6.3Kbps;

理论延时：37.5ms（30ms frame size + 1/4 subframe size）

音质：小于长途质量，MOS 3.7；
优点：码率低，带宽要求较小。并达到ITU-TG723要求的语音质量，性能稳定,避免了载波信号的时通时断。

缺点：声音质量一般；
应用领域：VOIP；
版税方式：Free
备注：

G.723.1是一个双速率的语音编码器，是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法；
其目标应用系统包括H.323、H.324等多媒体通信系统，目前该算法已成为IP电话系统中的必选算法之一；编码器首先对语音信号进行传统电话带宽的滤波（基于G.712），再对语音信号用传统8000-Hz速率进行抽样（基于G.711），并变换成16 bit线性PCM码作为该编码器的输入；在解码器中对输出进行逆操作来重构语音信号；高速率编码器使用多脉冲最大似然量化（MP-MLQ），低速率编码器使用代数码激励线性预测（ACELP）方法，编码器和解码器都必须支持此两种速率，并能够在帧间对两种速率进行转换；
此系统同样能够对音乐和其他音频信号进行压缩和解压缩，但它对语音信号来说是最优的；采用了执行不连续传输的静音压缩，这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外，这种技术使发信机的调制解调器保持连续工作，并且避免了载波信号的时通时断。

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型：ADPCM
编码速率：40Kbps、32Kbps、24Kbps、16Kbps;

理论延时：0.125ms（8kHz sample rate）

音质：32kbps，长途质量；
优点：计算简单，带宽是G.711的一半而音质接近；

缺点：占有带宽相对还是较高；
应用领域：VOIP，电话通信网络；
版税方式：free
备注：

G.726是G.721和G.723的联合，同时增加了16kbps ADPCM，但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半，所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中，24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输，而40 kbps 通道则被用于 DCME 中的数据解调信号（尤其是4800 kbps 或更高的调制解调器）。

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型：CELP
编码速率：16Kbps;

理论延时：0.625ms（8kHz sample rate）

音质：长途质量；
优点：低延时、抗误码能力非常强；

缺点：比其他的编码器都复杂；
应用领域：IP电话，数字移动通信、卫星通信；
版税方式：free
备注：

G.728 低延时码激励线性预测编码（LD-CELP）是世界上第一个标准化参数语音CODEC，以CELP算法为基础，采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法，达到了低延时的目的。

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型：CS-CELP
编码速率：8Kbps;

理论延时：15ms（10ms frame size + 1/2 subframe lookhead）

音质：长途质量；
优点：低码率，高音质，应用广泛；

缺点：算法复杂度较高；
应用领域：VOIP；
版税方式：free
备注：

国际电信联盟（ITU-T）于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)，它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”（CS-ACELP）算法。这种算法综合了波形编码和参数编码的优点，以自适应预测编码技术为基础，采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的，它的帧长只有10ms，处理时延也是10ms，再加上5ms的前视，这就使得G.729产生的点到点的时延为25ms，比特率为8 kbps。
96年ITU-T又制定了G.729的简化方案G.729A，主要降低了计算的复杂度以便于实时实现，因此目前使用的都是G.729A。

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型：CELP、TDBWE
编码速率：8Kbps~32kbps，12个码率;

理论延时：48.9375ms；

音质：未知；
优点：多码率，可与G.729、G.729A和G.729B实现完全操作；

缺点：应用未成熟；
应用领域：VOIP；
版税方式：有专利
备注：

G.729.1是一个可与G.729，G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz，在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s，G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧，算法时延为48.9375 ms。默认情况下，编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流，它分为12 层结构，分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断，从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构：低频带（50-4000 Hz）嵌入式码激励线性估计（CELP）编解码，高频带（4000-7000 Hz）时域带宽扩展（TDBWE）参量编解码，以及通过被称为时域混叠消除（TDAC）的估计变换编解码技术实现的全频带增强功能。

参考资料：

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：Facebook每年烧钱2亿美元实现盈利难度极大下一篇：自制Ping(3) IcmpSendEcho2Ex Demo

看更多

常用的ITU Speech Codec大全（G.711,G.722.1,G.722.2,G.723.1,G.

相關文章