⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 a-11-4.htm

📁 上海交通大学DSP学习的经典教程 文档为HTML格式,循序渐进,方便学习 本人从中收益菲浅,拿来共享
💻 HTM
字号:
<html><head><title>饮水思源精华区</title><Content-type: text/html; charset=gb2312><link rel=stylesheet type=text/css href="bbsdl.css"></head><table cellspacing=0 class=title width=90%><th class=title align=left width=20%>饮水思源站</th><th class=title align=center width=60%>文章阅读</th><th class=title align=right width=20%>精华区离线浏览</th></tr></table><hr><table align=center cellspacing=1 class=doc><tr><td>发信人:&nbsp;hahahaha&nbsp;(hahahaha),&nbsp;信区:&nbsp;DSP<br>标&nbsp;&nbsp;题:&nbsp;MPEG标准中的音频技术(四)<br>发信站:&nbsp;饮水思源站&nbsp;(Wed&nbsp;Jul&nbsp;12&nbsp;16:28:50&nbsp;2000),&nbsp;站内信件<br><br>对自然音(Natural&nbsp;Sound)来说,MPEG-4对自然音频码流作了标准化编码,码率范围<br>可以从2k&nbsp;bps到64k&nbsp;bps,为了在使音频质量在整个码率允许的范围内都达到最佳,多<br>种话音编码技术和音频压缩技术被MPEG-4融合进一个统一的架构中。<br><br>比如,2kbps&nbsp;到24kbps这段比特率属于话音编码的范围。在这段范围中,2kbps到4kbps<br>由HVXC(Harmonic&nbsp;Vector&nbsp;eXcitation&nbsp;Coding)处理,4kbps到24kbps由<br>CELP(Code&nbsp;Excited&nbsp;Linear&nbsp;Predictive)&nbsp;处理,它支持8KHZ和16KHZ两种采样率,<br>分别对应窄带和宽带话音。<br>对6kbps以上的一般音频编码来说,则多采用时频变换编码(Time-to-Frequency<br>Transform&nbsp;Coding)技术,主要包括TwinVQ&nbsp;和AAC。它们的采样率一般都远高于8KHZ。<br>MPEG-4的音频编码器和音频解码器都是可分级的。这里的比特率可分级尤其指带宽可<br>分级这一特殊情形,这使得比特流的每一部分同频谱的某一部分相对应,一个比特流<br>可以被分解为更低比特率的比特流,在传输或解码时可以根据实际情况丢弃某些高频<br>的细节码流,在音质降低的情况下仍能够保留原有比特流的大部分信息。<br>对合成音(Synthesized&nbsp;Sound)来说,MPEG-4的音频解码器能根据多种结构化的输入<br>合成声音。它主要包括两种合成方式:<br>1.&nbsp;TTS&nbsp;(Text&nbsp;To&nbsp;Speech)<br>这种方式所需要的比特率很低,约在200bps至1.2kbps之间,很适合于网络话音的传<br>送。它可以根据输入的文本及其所附带的韵律参数(音高,音素)等合成话音。另<br>外,它还可以生成同步参数,供配音时面部模仿(Face&nbsp;Animation)使用。但是,<br>由于TTS技术的多样性,MPEG-4只对TTS&nbsp;编码器的接口部分作了标准化规范,而具<br>体采样什么样的TTS&nbsp;合成技术,则最具体实现的不同而有所不同。<br>2.&nbsp;乐谱驱动(Score&nbsp;Driven)的音频合成<br>为了产生高质量的合成音频,MPEG-4定义了一种特殊的合成音频描述语言<br>SAOL(Structured&nbsp;Audio&nbsp;Orchestra&nbsp;Language),用来对各种合成方法进行描述。而<br>对音频合成的控制则通过乐谱驱动来完成。这里所谓的乐谱(Score)只是一段合<br>成命令的时间序列,由它来控制整个合成过程。为此,MPEG-4还定义了另一种描述<br>语言SASL(Structured&nbsp;Audio&nbsp;Score&nbsp;Language),用来对乐谱进行描述。由此,<br>使得MPEG-4的合成音频能产生各种复杂的视听效果。<br>*)&nbsp;MPEG-4&nbsp;Version&nbsp;2&nbsp;对音频部分的改进<br>在MPEG-4&nbsp;Version&nbsp;2中,对音频部分又作了进一步的改进,主要包括以下两点:<br>1.&nbsp;在发布方式上,加入了MPEG-J<br>&nbsp;&nbsp;&nbsp;MPEG-J是MPEG-4第二版中引入的一个可编程系统。它的实质是一套可以同Java内核<br>&nbsp;&nbsp;&nbsp;互操作的API。这使得音频/视频产品的网上发布更为便捷。<br>2.&nbsp;对音频质量的进一步改进<br>&nbsp;&nbsp;&nbsp;MPEG-4&nbsp;第二版中改进了原先的音频码流结构,使得其容错性能进一步提高,<br>&nbsp;&nbsp;&nbsp;同时增加了场景描述参数,使得场景效果,如大厅的3维音响效果等得以重现。<br>&nbsp;&nbsp;&nbsp;另外,它还改进了编解码器的效率,减小编解码延迟,并细化了音频分级的颗粒<br>&nbsp;&nbsp;&nbsp;度。这使得MPEG-4的音频音质得到了进一步提高,从而适合于更多的应用场合。<br><br>--<br>不可能人人都成为英雄,但人人都可以有所进步。<br><br>※&nbsp;来源:·饮水思源站&nbsp;bbs.sjtu.edu.cn·[FROM:&nbsp;202.120.8.44]<br></tr></table><br><caption align=bottom><hr><table align=center cellspacing=1 class=foot><tr><td class=foot><a href="a-11.htm">返回</tr></table><p class=copyr align=center>Copyright &copy; 2001 <a class=copyr href="http://bbs.sjtu.edu.cn">SJTUBBS</a>, All Rights Reserved.<br><br>版权所有<a class=copyr href="telnet://bbs.sjtu.edu.cn">上海交大BBS饮水思源站</a></caption></body></html>

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -