📄 intro_3_1__viewing_a_spectrogram.html
字号:
<html><head><meta name="robots" content="index,follow">
<title>入门教程 3.1. 查看三维语图</title></head><body bgcolor="#FFFFFF">
<table border=0 cellpadding=0 cellspacing=0><tr><td bgcolor="#CCCC00"><table border=4 cellpadding=9><tr><td align=middle bgcolor="#000000"><font face="Palatino,Times" size=6 color="#999900"><b>
入门教程 3.1. 查看三维语图
</b></font></table></table>
<p>
想要观察一段声音作为时间的函数的频谱特征,只要选中一个<a href="Sound.html">Sound(声音)</a>或<a href="LongSound.html">LongSound(长声音)</a>对象并按<a href="Edit.html">Edit(编辑)</a>按钮。屏幕上出现<a href="SoundEditor.html">SoundEditor(声音编辑器)</a>或<a href="LongSoundEditor.html">LongSoundEditor(长声音编辑器)</a>窗口。窗口整个下半部分可以见到一张浅灰色图像,就是所谓<i>三维语图</i>了。假如看不见,请执行<b>Spectrogram(三维语图)</b>选单下的<a href="Show_spectrogram.html">Show spectrogram(显示三维语图)</a>命令。</p>
<p>
三维语图对声音的一种<a href="spectro-temporal_representation.html">频谱-时间表示</a>。三维语图水平方向表示<a href="time.html">时间</a>,垂直方向表示<a href="frequency.html">频率</a>。三维语图的时间尺度与波形图相同,因而对缩放和滚动的反应也完全同步。三维语图左侧可以见到频率标尺。三维语图底部的频率值通常是0 Hz(赫兹,又叫cps,周每秒),而顶部的值通常是5000 Hz。</p>
<p>
三维语图上较深的颜色表示较高的能量密度,较浅的颜色则表示较低的能量密度。如果三维语图在4000 Hz位置上有连续1.2秒时间的深色区域,表明这段声音在那段时间内如此高频位置上的能量很多。大量语音的三维语图样例,参看教材:<a href="Ladefoged__2001_.html">Ladefoged (2001)</a>和参考书:<a href="Ladefoged___Maddieson__1996_.html">Ladefoged & Maddieson (1996)</a>。</p>
<p>
想要查看三维语图上某点相应的时刻与频率,只要单击三维语图,垂直的时刻指针即在波形图上方显示出时刻,而水平频率指针则在三维语图左侧显示出频率。这是测度元音<i>共振峰</i>频率及擦音主要频谱峰线的方法之一。</p>
<h3>
喂,边缘上有条空白的垂直条呢!</h3>
<p>
这很正常。声谱分析要求<i>分析时窗</i>至少有一定的时长。举个例子:如果Praat需要获知位于1.342秒时刻的声谱,就需要以该时刻前后10毫秒时窗内的信号信息为参考,也就是说,Praat将用到1.337至1.347秒间所有的信号信息。声音紧靠边缘的地方无法提供这种信息——如若声音始于0秒而终于1.8秒,则0至0.005秒以及1.795至1.800秒的区间无法求算声谱。空白条就是这么来的。假如您刚打开一段声音时看不见,请在声音的开头或末尾放大观察。</p>
<p>
放大到声音的中间部分(或其他离开边缘的位置),空白条即告消失。比方说,您突然跳转到只显示0.45至1.35秒的位置上了。可是,Praat并没有忘记超出时窗边缘的信号信息。为了显示0.45至1.35秒之间的三维语图,Praat会用到0.445至1.355秒之间的波形信息,这样一来,窗口的边缘就看不到空白条。</p>
<h3>
喂,我一滚动图就变了呢!</h3>
<p>
这也很正常,尤其是对于较长的时窗。假如可见的时间时窗长达20秒,而窗口在水平方向有1000像素,那么您会以为每个1像素宽的垂直线应该代表20毫秒的声音的频谱。然而,出于计算速度的考量,Praat显示的只是那20毫秒正中央的声谱,不会平均或合计那20毫秒的声谱。这种对隐含三维语图的<i>不足采样</i>与波形图的绘制有所区别:波形图上的黑色垂直线两端就是1个像素覆盖下所有采样点振幅的最高和最低点。三维语图则无法照此处理。而且,由于滚动是取一定的时间为步长(即窗口内可见部分时长的5%),而不依据整数个屏幕像素,所以每当滚动时,步长像素序列的中心就可能取到三维语图上不同的位置。视图的变化就是这样产生的。如果窗口内可见部分不过几秒,三维语图的滚动就会显得平滑多了。</p>
<p>
三维语图上的深颜色也会随着滚动而有所变化,因为定义的是黑色代表能量最大的可见部分。一旦正好信号中能量大的部分滚动得看不见了,三维语图就要变深。下一节将介绍一种方法消除这种现象。</p>
<h3>指向本页的链接</h3>
<ul>
<li><a href="Intro.html">入门教程</a>
<li><a href="Intro_3__Spectral_analysis.html">入门教程 3. 声谱分析</a>
</ul>
<hr>
<address>
<p>© ppgb, May 13, 2003</p>
<p>© 翻译:徐清白,2005年04月01日</p>
</address>
</body>
</html>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -