搜索
首页数据库mysql教程常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

总结了常用的ITU Speech Codec,谨供大家学习参考: 1、 G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM 编码速率:64Kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩

总结了常用的ITU Speech Codec,谨供大家学习参考:

1、G.711: Pulse code modulation (PCM) of voice frequencies

 

编码类型:压扩PCM
编码速率:64Kbps

理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);

音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:

     70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

     G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。

 

 

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32kHz采样的更高码率版本);

理论延时:40ms(20ms frame size + 20ms lookhead)

音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;

缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:Free
备注:   

      G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。

 

 

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;

理论延时:25ms(20ms frame size + 1/4 subframe size)

音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;

缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注: 

      AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;

理论延时:37.5ms(30ms frame size + 1/4 subframe size)

音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。

缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:

 G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

 

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;

理论延时:0.125ms(8kHz sample rate)

音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;

缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:

     G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 μ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。

 

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型:CELP
编码速率:16Kbps;

理论延时:0.625ms(8kHz sample rate)

音质:长途质量;
优点:低延时、抗误码能力非常强;

缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:

    G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。 

 

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型:CS-CELP
编码速率:8Kbps;

理论延时:15ms(10ms frame size + 1/2 subframe lookhead)

音质:长途质量;
优点:低码率,高音质,应用广泛;

缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:

      国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

 

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;

理论延时:48.9375ms;

音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;

缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注: 

G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。

 

 

参考资料:

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
您可以使用哪些工具来监视MySQL性能?您可以使用哪些工具来监视MySQL性能?Apr 23, 2025 am 12:21 AM

如何有效监控MySQL性能?使用mysqladmin、SHOWGLOBALSTATUS、PerconaMonitoringandManagement(PMM)和MySQLEnterpriseMonitor等工具。1.使用mysqladmin查看连接数。2.用SHOWGLOBALSTATUS查看查询数。3.PMM提供详细性能数据和图形化界面。4.MySQLEnterpriseMonitor提供丰富的监控功能和报警机制。

MySQL与SQL Server有何不同?MySQL与SQL Server有何不同?Apr 23, 2025 am 12:20 AM

MySQL和SQLServer的区别在于:1)MySQL是开源的,适用于Web和嵌入式系统,2)SQLServer是微软的商业产品,适用于企业级应用。两者在存储引擎、性能优化和应用场景上有显着差异,选择时需考虑项目规模和未来扩展性。

在哪些情况下,您可以选择SQL Server而不是MySQL?在哪些情况下,您可以选择SQL Server而不是MySQL?Apr 23, 2025 am 12:20 AM

在需要高可用性、高级安全性和良好集成性的企业级应用场景下,应选择SQLServer而不是MySQL。1)SQLServer提供企业级功能,如高可用性和高级安全性。2)它与微软生态系统如VisualStudio和PowerBI紧密集成。3)SQLServer在性能优化方面表现出色,支持内存优化表和列存储索引。

MySQL如何处理角色集和碰撞?MySQL如何处理角色集和碰撞?Apr 23, 2025 am 12:19 AM

mySqlManagesCharacterSetsetSandCollat​​ionsyutusututf-8asthEdeFault,允许ConfigurationAtdataBase,table和columnlevels,AndrequiringCarefullageLignmentToavoidMismatches.1)setDefeaultCharactersetTercharactersetEtCollacterSeteTandColletationForAdataBase.2)conformentcollecharactersettersetertersetcollat​​ertersetcollat​​ioncollat​​ion

MySQL中有什么触发器?MySQL中有什么触发器?Apr 23, 2025 am 12:11 AM

MySQL触发器是与表相关联的自动执行的存储过程,用于在特定数据操作时执行一系列操作。1)触发器定义与作用:用于数据校验、日志记录等。2)工作原理:分为BEFORE和AFTER,支持行级触发。3)使用示例:可用于记录薪资变更或更新库存。4)调试技巧:使用SHOWTRIGGERS和SHOWCREATETRIGGER命令。5)性能优化:避免复杂操作,使用索引,管理事务。

您如何在MySQL中创建和管理用户帐户?您如何在MySQL中创建和管理用户帐户?Apr 22, 2025 pm 06:05 PM

在MySQL中创建和管理用户账户的步骤如下:1.创建用户:使用CREATEUSER'newuser'@'localhost'IDENTIFIEDBY'password';2.分配权限:使用GRANTSELECT,INSERT,UPDATEONmydatabase.TO'newuser'@'localhost';3.修正权限错误:使用REVOKEALLPRIVILEGESONmydatabase.FROM'newuser'@'localhost';然后重新分配权限;4.优化权限:使用SHOWGRA

MySQL与Oracle有何不同?MySQL与Oracle有何不同?Apr 22, 2025 pm 05:57 PM

MySQL适合快速开发和中小型应用,Oracle适合大型企业和高可用性需求。1)MySQL开源、易用,适用于Web应用和中小型企业。2)Oracle功能强大,适合大型企业和政府机构。3)MySQL支持多种存储引擎,Oracle提供丰富的企业级功能。

与其他关系数据库相比,使用MySQL的缺点是什么?与其他关系数据库相比,使用MySQL的缺点是什么?Apr 22, 2025 pm 05:49 PM

MySQL相比其他关系型数据库的劣势包括:1.性能问题:在处理大规模数据时可能遇到瓶颈,PostgreSQL在复杂查询和大数据处理上表现更优。2.扩展性:水平扩展能力不如GoogleSpanner和AmazonAurora。3.功能限制:在高级功能上不如PostgreSQL和Oracle,某些功能需要更多自定义代码和维护。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。