📄 linux音频编程指南.htm

📁 介绍声卡编程的一些资料
💻 HTM
📖 第 1 页 / 共 4 页
字号:
	perror("ioctl sample format");
	return -1;
}
// 检查设置值的正确性
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>声卡采样频率的设置也非常容易，只需在调用ioctl时将第二个参数的值设置为SNDCTL_DSP_SPEED，同时在第三个参数中指定采样频率的数值就行了。对于大多数声卡来说，其支持的采样频率范围一般为5kHz到44.1kHz或者48kHz，但并不意味着该范围内的所有频率都会被硬件支持，在Linux下进行音频编程时最常用到的几种采样频率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。下面的代码示范了如何设置声卡的采样频率：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
int rate = 22050;
int result = ioctl(handle, SNDCTL_DSP_SPEED, &amp;rate);
if ( result == -1 ) {
	perror("ioctl sample format");
	return -1;
}
// 检查设置值的正确性
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P><SPAN class=atitle3>4.2 Mixer编程</SPAN></P>
      <P>声卡上的混音器由多个混音通道组成，它们可以通过驱动程序提供的设备文件/dev/mixer进行编程。对混音器的操作是通过ioctl系统调用来完成的，并且所有控制命令都由SOUND_MIXER或者MIXER开头，表1列出了常用的几个混音器控制命令：</P>
      <TABLE width="60%" border=1>
        <TBODY>
        <TR>
          <TD>名 称</TD>
          <TD>作 用</TD></TR>
        <TR>
          <TD>SOUND_MIXER_VOLUME</TD>
          <TD>主音量调节</TD></TR>
        <TR>
          <TD>SOUND_MIXER_BASS</TD>
          <TD>低音控制</TD></TR>
        <TR>
          <TD>SOUND_MIXER_TREBLE</TD>
          <TD>高音控制</TD></TR>
        <TR>
          <TD>SOUND_MIXER_SYNTH</TD>
          <TD>FM合成器</TD></TR>
        <TR>
          <TD>SOUND_MIXER_PCM</TD>
          <TD>主D/A转换器</TD></TR>
        <TR>
          <TD>SOUND_MIXER_SPEAKER</TD>
          <TD>PC喇叭</TD></TR>
        <TR>
          <TD>SOUND_MIXER_LINE</TD>
          <TD>音频线输入</TD></TR>
        <TR>
          <TD>SOUND_MIXER_MIC</TD>
          <TD>麦克风输入</TD></TR>
        <TR>
          <TD>SOUND_MIXER_CD</TD>
          <TD>CD输入</TD></TR>
        <TR>
          <TD>SOUND_MIXER_IMIX</TD>
          <TD>回放音量</TD></TR>
        <TR>
          <TD>SOUND_MIXER_ALTPCM</TD>
          <TD>从D/A 转换器</TD></TR>
        <TR>
          <TD>SOUND_MIXER_RECLEV</TD>
          <TD>录音音量</TD></TR>
        <TR>
          <TD>SOUND_MIXER_IGAIN</TD>
          <TD>输入增益</TD></TR>
        <TR>
          <TD>SOUND_MIXER_OGAIN</TD>
          <TD>输出增益</TD></TR>
        <TR>
          <TD>SOUND_MIXER_LINE1</TD>
          <TD>声卡的第1输入</TD></TR>
        <TR>
          <TD>SOUND_MIXER_LINE2</TD>
          <TD>声卡的第2输入</TD></TR>
        <TR>
          <TD>SOUND_MIXER_LINE3</TD>
          <TD>声卡的第3输入</TD></TR></TBODY></TABLE><BR>表1 混音器命令 
      <P>对声卡的输入增益和输出增益进行调节是混音器的一个主要作用，目前大部分声卡采用的是8位或者16位的增益控制器，但作为程序员来讲并不需要关心这些，因为声卡驱动程序会负责将它们变换成百分比的形式，也就是说无论是输入增益还是输出增益，其取值范围都是从0到100。在进行混音器编程时，可以使用SOUND_MIXER_READ宏来读取混音通道的增益大小，例如在获取麦克风的输入增益时，可以使用如下的代码：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
int vol;
ioctl(fd, SOUND_MIXER_READ(SOUND_MIXER_MIC), &amp;vol);
printf("Mic gain is at %d %%\n", vol);
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>对于只有一个混音通道的单声道设备来说，返回的增益大小保存在低位字节中。而对于支持多个混音通道的双声道设备来说，返回的增益大小实际上包括两个部分，分别代表左、右两个声道的值，其中低位字节保存左声道的音量，而高位字节则保存右声道的音量。下面的代码可以从返回值中依次提取左右声道的增益大小：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
int left, right;
left = vol &amp; 0xff;
right = (vol &amp; 0xff00) &gt;&gt; 8;
printf("Left gain is %d %%, Right gain is %d %%\n", left, right);
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>类似地，如果想设置混音通道的增益大小，则可以通过SOUND_MIXER_WRITE宏来实现，此时遵循的原则与获取增益值时的原则基本相同，例如下面的语句可以用来设置麦克风的输入增益：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
vol = (right &lt;&lt; 8) + left;
ioctl(fd, SOUND_MIXER_WRITE(SOUND_MIXER_MIC), &amp;vol);
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>在编写实用的音频程序时，混音器是在涉及到兼容性时需要重点考虑的一个对象，这是因为不同的声卡所提供的混音器资源是有所区别的。声卡驱动程序提供了多个ioctl系统调用来获得混音器的信息，它们通常返回一个整型的位掩码（bitmask），其中每一位分别代表一个特定的混音通道，如果相应的位为1，则说明与之对应的混音通道是可用的。例如通过SOUND_MIXER_READ_DEVMASK返回的位掩码，可以查询出能够被声卡支持的每一个混音通道，而通过SOUND_MIXER_READ_RECMAS返回的位掩码，则可以查询出能够被当作录音源的每一个通道。下面的代码可以用来检查CD输入是否是一个有效的混音通道：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
  ioctl(fd, SOUND_MIXER_READ_DEVMASK, &amp;devmask);
if (devmask &amp; SOUND_MIXER_CD)
  printf("The CD input is supported");
  </CODE></PRE></TD></TR></TBODY></TABLE>
      <P>如果进一步还想知道其是否是一个有效的录音源，则可以使用如下语句：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
ioctl(fd, SOUND_MIXER_READ_RECMASK, &amp;recmask);
if (recmask &amp; SOUND_MIXER_CD)
  printf("The CD input can be a recording source");
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>目前大多数声卡提供多个录音源，通过SOUND_MIXER_READ_RECSRC可以查询出当前正在使用的录音源，同一时刻能够使用几个录音源是由声卡硬件决定的。类似地，使用SOUND_MIXER_WRITE_RECSRC可以设置声卡当前使用的录音源，例如下面的代码可以将CD输入作为声卡的录音源使用：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
devmask = SOUND_MIXER_CD;
ioctl(fd, SOUND_MIXER_WRITE_DEVMASK, &amp;devmask);
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P>此外，所有的混音通道都有单声道和双声道的区别，如果需要知道哪些混音通道提供了对立体声的支持，可以通过SOUND_MIXER_READ_STEREODEVS来获得。</P>
      <P><SPAN class=atitle3>4.3 音频录放框架</SPAN></P>
      <P>下面给出一个利用声卡上的DSP设备进行声音录制和回放的基本框架，它的功能是先录制几秒种音频数据，将其存放在内存缓冲区中，然后再进行回放，其所有的功能都是通过读写/dev/dsp设备文件来完成的：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
/*
 * sound.c
 */
#include &lt;unistd.h&gt;
#include &lt;fcntl.h&gt;
#include &lt;sys/types.h&gt;
#include &lt;sys/ioctl.h&gt;
#include &lt;stdlib.h&gt;
#include &lt;stdio.h&gt;
#include &lt;linux/soundcard.h&gt;

#define LENGTH 3    /* 存储秒数 */
#define RATE 8000   /* 采样频率 */
#define SIZE 8      /* 量化位数 */
#define CHANNELS 1  /* 声道数目 */

/* 用于保存数字音频数据的内存缓冲区 */
unsigned char buf[LENGTH*RATE*SIZE*CHANNELS/8];

int main()
{
  int fd;	/* 声音设备的文件描述符 */
  int arg;	/* 用于ioctl调用的参数 */
  int status;   /* 系统调用的返回值 */

  /* 打开声音设备 */
  fd = open("/dev/dsp", O_RDWR);
  if (fd &lt; 0) {
    perror("open of /dev/dsp failed");
    exit(1);
  }

  /* 设置采样时的量化位数 */
  arg = SIZE;
  status = ioctl(fd, SOUND_PCM_WRITE_BITS, &amp;arg);
  if (status == -1)
    perror("SOUND_PCM_WRITE_BITS ioctl failed");
  if (arg != SIZE)
    perror("unable to set sample size");

  /* 设置采样时的声道数目 */
  arg = CHANNELS; 
  status = ioctl(fd, SOUND_PCM_WRITE_CHANNELS, &amp;arg);
  if (status == -1)
    perror("SOUND_PCM_WRITE_CHANNELS ioctl failed");
  if (arg != CHANNELS)
    perror("unable to set number of channels");

  /* 设置采样时的采样频率 */
  arg = RATE;
  status = ioctl(fd, SOUND_PCM_WRITE_RATE, &amp;arg);
  if (status == -1)
    perror("SOUND_PCM_WRITE_WRITE ioctl failed");

  /* 循环，直到按下Control-C */
  while (1) {
    printf("Say something:\n");
    status = read(fd, buf, sizeof(buf)); /* 录音 */
    if (status != sizeof(buf))
      perror("read wrong number of bytes");

    printf("You said:\n");
    status = write(fd, buf, sizeof(buf)); /* 回放 */
    if (status != sizeof(buf))
      perror("wrote wrong number of bytes");

    /* 在继续录音前等待回放结束 */
    status = ioctl(fd, SOUND_PCM_SYNC, 0); 
    if (status == -1)
      perror("SOUND_PCM_SYNC ioctl failed");
  }
}
</CODE></PRE></TD></TR></TBODY></TABLE>
      <P><SPAN class=atitle3>4.4 混音器框架</SPAN></P>
      <P>下面再给出一个对混音器进行编程的基本框架，利用它可以对各种混音通道的增益进行调节，其所有的功能都是通过读写/dev/mixer设备文件来完成的：</P>
      <TABLE cellSpacing=0 cellPadding=5 width="100%" bgColor=#cccccc 
        border=1><TBODY>
        <TR>
          <TD><PRE><CODE>
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -