📄 a-11-4.htm
字号:
<html><head><title>饮水思源精华区</title><Content-type: text/html; charset=gb2312><link rel=stylesheet type=text/css href="bbsdl.css"></head><table cellspacing=0 class=title width=90%><th class=title align=left width=20%>饮水思源站</th><th class=title align=center width=60%>文章阅读</th><th class=title align=right width=20%>精华区离线浏览</th></tr></table><hr><table align=center cellspacing=1 class=doc><tr><td>发信人: hahahaha (hahahaha), 信区: DSP<br>标 题: MPEG标准中的音频技术(四)<br>发信站: 饮水思源站 (Wed Jul 12 16:28:50 2000), 站内信件<br><br>对自然音(Natural Sound)来说,MPEG-4对自然音频码流作了标准化编码,码率范围<br>可以从2k bps到64k bps,为了在使音频质量在整个码率允许的范围内都达到最佳,多<br>种话音编码技术和音频压缩技术被MPEG-4融合进一个统一的架构中。<br><br>比如,2kbps 到24kbps这段比特率属于话音编码的范围。在这段范围中,2kbps到4kbps<br>由HVXC(Harmonic Vector eXcitation Coding)处理,4kbps到24kbps由<br>CELP(Code Excited Linear Predictive) 处理,它支持8KHZ和16KHZ两种采样率,<br>分别对应窄带和宽带话音。<br>对6kbps以上的一般音频编码来说,则多采用时频变换编码(Time-to-Frequency<br>Transform Coding)技术,主要包括TwinVQ 和AAC。它们的采样率一般都远高于8KHZ。<br>MPEG-4的音频编码器和音频解码器都是可分级的。这里的比特率可分级尤其指带宽可<br>分级这一特殊情形,这使得比特流的每一部分同频谱的某一部分相对应,一个比特流<br>可以被分解为更低比特率的比特流,在传输或解码时可以根据实际情况丢弃某些高频<br>的细节码流,在音质降低的情况下仍能够保留原有比特流的大部分信息。<br>对合成音(Synthesized Sound)来说,MPEG-4的音频解码器能根据多种结构化的输入<br>合成声音。它主要包括两种合成方式:<br>1. TTS (Text To Speech)<br>这种方式所需要的比特率很低,约在200bps至1.2kbps之间,很适合于网络话音的传<br>送。它可以根据输入的文本及其所附带的韵律参数(音高,音素)等合成话音。另<br>外,它还可以生成同步参数,供配音时面部模仿(Face Animation)使用。但是,<br>由于TTS技术的多样性,MPEG-4只对TTS 编码器的接口部分作了标准化规范,而具<br>体采样什么样的TTS 合成技术,则最具体实现的不同而有所不同。<br>2. 乐谱驱动(Score Driven)的音频合成<br>为了产生高质量的合成音频,MPEG-4定义了一种特殊的合成音频描述语言<br>SAOL(Structured Audio Orchestra Language),用来对各种合成方法进行描述。而<br>对音频合成的控制则通过乐谱驱动来完成。这里所谓的乐谱(Score)只是一段合<br>成命令的时间序列,由它来控制整个合成过程。为此,MPEG-4还定义了另一种描述<br>语言SASL(Structured Audio Score Language),用来对乐谱进行描述。由此,<br>使得MPEG-4的合成音频能产生各种复杂的视听效果。<br>*) MPEG-4 Version 2 对音频部分的改进<br>在MPEG-4 Version 2中,对音频部分又作了进一步的改进,主要包括以下两点:<br>1. 在发布方式上,加入了MPEG-J<br> MPEG-J是MPEG-4第二版中引入的一个可编程系统。它的实质是一套可以同Java内核<br> 互操作的API。这使得音频/视频产品的网上发布更为便捷。<br>2. 对音频质量的进一步改进<br> MPEG-4 第二版中改进了原先的音频码流结构,使得其容错性能进一步提高,<br> 同时增加了场景描述参数,使得场景效果,如大厅的3维音响效果等得以重现。<br> 另外,它还改进了编解码器的效率,减小编解码延迟,并细化了音频分级的颗粒<br> 度。这使得MPEG-4的音频音质得到了进一步提高,从而适合于更多的应用场合。<br><br>--<br>不可能人人都成为英雄,但人人都可以有所进步。<br><br>※ 来源:·饮水思源站 bbs.sjtu.edu.cn·[FROM: 202.120.8.44]<br></tr></table><br><caption align=bottom><hr><table align=center cellspacing=1 class=foot><tr><td class=foot><a href="a-11.htm">返回</tr></table><p class=copyr align=center>Copyright © 2001 <a class=copyr href="http://bbs.sjtu.edu.cn">SJTUBBS</a>, All Rights Reserved.<br><br>版权所有<a class=copyr href="telnet://bbs.sjtu.edu.cn">上海交大BBS饮水思源站</a></caption></body></html>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -