虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

语音技术

语音技术是指在计算机领域中的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)。
  • 基于ARM网络语音AGC系统的研究及实现.pdf

    语音通信是人类通信的重要组成部分,伴随着数字通信技术和计算机技术的发展,特别是Internet的出现,基于因特网的数字语音通信技术得了到迅速的发展。由于设备、环境、人为操作等因素的影响,网络上传输的语音信号可能出现忽大忽小的情况,为了得到较好的语音信号输出效果,需要在接收端对语音信号进行处理。针对以上情况,本文研究并实现了基于ARM的网络语音AGC系统。 本文结合嵌入式系统和AGC技术的发展,设计实现了一个基于ARM的网络语音AGC系统。本文首先对AGC算法进行了深入研究,在对LMS算法进行研究的基础上提出了一种基于LMS的数字语音AGC算法,通过Matlab软件对算法进行了仿真;设计了一个由AT91RM9200微处理器、网络控制器、音频芯片构成的嵌入式AGC处理终端硬件平台,构建了嵌入式Linux操作系统,并在此基础上设计实现了网络语音AGC系统的下位机终端。该终端主要实现了用基于LMS的数字语音AGC算法实时地处理从网络上传过来的忽大忽小的数字语音信号,取得良好的语音信号输出,并且稳定性可靠;设计实现了上位PC机程序,上位机实现了通过网络将数字语音信号实时地传送到嵌入式终端的功能。 本设计采用高性能微处理器,配合嵌入式Linux强大支持功能的实现方案,具有高性能、低成本、小型化、实时性强等诸多优点。相比传统的实现架构,该设计具有更好的灵活性和操作性,性价比更高,功能更强大,同时可扩展性和可移植性也更好,具有一定的技术先进性和广泛的应用前景。

    标签: ARM AGC 网络语音

    上传时间: 2013-06-11

    上传用户:几何公差

  • 基于ARM的嵌入式语音识别系统研究

    语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。

    标签: ARM 嵌入式 语音识别 系统研究

    上传时间: 2013-05-30

    上传用户:wsx123

  • 基于ARM的语音采集与网络传输系统的设计

    利用ARM处理器开发处理音频信号的设备很多,如移动电话、MD(MiniDisc),DVD播放器、MP3音频译码器等;同样,基于ARM处理器的网络设备也很多,如网络调制解调器、网络电脑、因特网设备等。但利用ARM处理器把语音处理和网络通信功能结合起来无疑是一种新的尝试,它的设计成功会给网络留言技术的开发提供一种新的思路。 本文通过一个ARM9芯片S3C2410作为处理器的嵌入式语音采集系统,详细阐述了嵌入式系统的设计与开发过程,其中包括: 交叉编译环境的搭建:交叉编译环境是嵌入式开发工具的集合,搭建该环境就是在系统中编译安装开发工具链。 操作系统内核的移植:这是嵌入式开发的主要单元之一,移植内核主要是对内核进行重新配置,使它符合特定系统的需要,然后重新编译生成可执行的内核镜像文件。 文件系统的移植:文件系统是操作系统对数据进行管理的有效和必要的助手。移植文件系统包括制作文件系统镜像、在Flash上为文件系统分配存储空间以及文件系统与嵌入式操作系统的有效配合。 驱动程序的设计:驱动是操作系统与硬件沟通的桥梁,驱动设计就是编写具体硬件的读写控制函数并向操作系统提供统一的接口。 本文更着重于介绍实际开发中使用的技术以及遇到的问题和解决方法。在第4章中结合语音芯片UDA1341TS阐述了语音数据的采集与处理;结合网卡控制芯片CS8900A阐述了网络通信和网卡的驱动,以及网络开发中遇到的问题和解决方法。

    标签: ARM 语音采集 网络传输

    上传时间: 2013-07-11

    上传用户:luopoguixiong

  • 小词汇量非特定人孤立词语音识别的FPGA实现

    语音识别技术是信息技术领域的重要发展方向之一,小词汇量非特定人孤立词语音识别是语音识别领域中一个具有广泛应用背景的分支,在家电遥控、智能玩具、人机交互等领域有着重要的应用价值.语音识别芯片从20世纪90年代开始出现,目前的语音识别芯片都是以DSP为核心集成的语音识别系统,算法主要通过软件实现,为了提高速度和降低成本,下一代语音识别芯片将设计成软硬件协同实现,本文的目的是使用全硬件方法实现语音识别算法,为软硬件协同实现的方案提供参考.本论文主要完成了以下工作:(1)在选定的FPGA平台上,完成了整个系统的硬件设计.(2)对于硬件中难于实现而且占用较多资源的乘法器、求对数、求平方根以及快速傅立叶变换等关键模块,本文都根据电路的具体特点,给出了巧妙的实现方案,完成了算法需要的功能.(3)设计中使用了模块复用和流水线技术.(4)根据设计结果,给出了各个模块占用的硬件资源和运行速度.实验结果表明,本文所设计的硬件系统能够正常工作,在速度和面积方面都达到了设计要求.

    标签: FPGA 词汇 语音识别

    上传时间: 2013-06-12

    上传用户:01010101

  • G729A语音编解码算法研究及FPGA实现

    语音编码技术始终是语音研究的热点。语音编码作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视。G729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的,国际电信联盟(ITU-T)于1995年11月正式通过了G729。96年ITU-T又制定了G729的简化方案G729A,主要降低了计算的复杂度以便于实时实现。因其具有良好的合成语音质量、适中的复杂度、较低的时延等优点,G729A标准已被广泛应用在VOIP网关、IP电话中。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对G729A语音编码中的线性预测(LP)滤波器系数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音信号处理及其发展进行介绍,深入讨论了G729A语音编解码技术。第二,对Altera公司的Stratix系列可编程器件的内部结构进行了研究,分析了在QuartusII开发平台上进行FPGA设计的流程。第三,基于FPGA,对G729A编码系统的LP分析部分做了具体设计,其中包括自相关函数和杜宾(Durbin)递推两个主要功能模块,并对其工作过程进行了详细的分析。第四,针对系统所使用的除法运算都是商小于1的特点,设计并实现了一个系统专用的除法器模块。最后,在Altera FPGA目标芯片EP1S30F780C7上,对LP分析系统进行了验证,证明了方案的可行性。

    标签: G729A FPGA 语音编解码 算法研究

    上传时间: 2013-04-24

    上传用户:miaochun888

  • 基于FPGA的GSM系统信道编码技术研究

    本论文是以GSM基站系统为对象研究了软件无线电思想在移动通信中应用的可行性,通过构造一个具有开放性、标准化、模块化的通用硬件平台,用软件来完成各种功能。 本文首先从整体上介绍了GSM移动通信系统及其实现过程,通过大量的Matlab仿真详细论述了GSM蜂窝通信系统中的语音编码、信道编码、交织、加密、调制等技术。 其次,文中介绍了GSM信道编码规则,其中重点阐述了CRC、卷积码和交织码的基本原理和算法实现,并完成了三者编码译码的软件设计,采用FPGA技术实现并验证了设计的正确性。 最后,对GMSK调制和解调的原理及特点进行论述,并提出了软件实现的可行性方案,为下一步的软件设计打下了坚实的基础。硬件试验平台是软件实现的基础,因此,文中进行了详细的分析与设计,并给出了部分电路设计图,对相关课题的研究具有一定的指导意义和参考价值。

    标签: FPGA GSM 信道编码

    上传时间: 2013-07-11

    上传用户:plsee

  • 基于FPGA的数据采集与处理技术的研究

    目前,数字信号处理广泛应用于通信、雷达、声纳、语音与图像处理等领域,信号处理算法理论己趋于成熟,但其具体硬件实现方法却值得探讨。FPGA是近年来广泛应用的超大规模、超高速的可编程逻辑器件,由于其具有高集成度、高速、可编程等优点,大大推动了数字系统设计的单片化、自动化,缩短了单片数字系统的设计周期、提高了设计的灵活性和可靠性,在超高速信号处理和实时测控方面有非常广泛的应用。本文对FPGA的数据采集与处理技术进行研究,基于FPGA在数据采样控制和信号处理方面的高性能和单片系统发展的新热点,把FPGA作为整个数据采集与处理系统的控制核心。主要研究内容如下: FPGA的单片系统研究。针对数据采集与处理,对FPGA进行选型,设计了基于FPGA的单片系统的结构。把整个控制系统分为三个部分:多通道采样控制模块,数据处理模块,存储控制模块。 多通道采样控制模块的设计。利用4片AD7506和一片AD7862对64路模拟量进行周期采样,分别设计了通道选择控制模块和A/D转换控制模块,并进行了仿真,完成了基于FPGA的多通道采样控制。 数据处理模块的设计。FFT算法在数字信号处理中占有重要的地位,因此本文研究了FFT的硬件实现结构,提出了用FPGA实现FFT的一种设计思想,给出了总体实现框图。分别设计了旋转因子复数乘法器,碟形运算单元,存储器,控制器,并分别进行了仿真。重点设计实现了FFT算法中的蝶形处理单元,采用了一种高效乘法器算法设计实现了蝶形处理单元中的旋转因子乘法器,从而提高了蝶形处理器的运算速度,降低了运算复杂度。理论分析和仿真结果表明,状态机控制器成功地对各个模块进行了有序、协调的控制。 存储控制模块的设计。利用闪存芯片K9K1G08UOA对采集处理后的数据进行存储,设计了FPGA与闪存的硬件连接,设计了存储控制模块。 本文对FFT算法的硬件实现进行了研究,结合单片系统的特点,把整个系统分为多通道采样控制模块,数据处理模块,存储控制模块进行设计和仿真。设计采用VHDL编写程序的源代码。仿真测试结果表明,此FPGA单片系统可完成对实时信号的高速采集与处理。

    标签: FPGA 数据采集 处理技术

    上传时间: 2013-07-06

    上传用户:eclipse

  • 基于单片机语音识别的智能家居控制系统实现方案

    · 摘要:  本文利用了十六位SPCE061A单片机的强大的DSP功能,实现了特定发音人识别(Speaker Dependent)功能.结合大容量的FLASH存储器,成功地实现将语音播放与识别技术应用于智能家居控制系统中.另外,详细介绍了具有语音识别功能的新一代智能家居控制系统的硬件配置与软件流程,从而在实现系统功能的同时,将低成本、低功耗与友好人机界面有机结合起来. 

    标签: 单片机 语音识别 智能家居控制系统 实现方案

    上传时间: 2013-04-24

    上传用户:xwd2010

  • 《语音处理与识别》

    ·语音处理与识别是利用计算机对语音信号进行分奸和综和,实现对人类语音的自动理解和处理的一门学科.本书共八章,即语音信号数字处理基础、语音信号时域处理方法、语音波形数字编码、短时博里叶分析、语音信号同态处理及线性预测编码、语音识别方法与系统等。本书可作通信工程、无线电技术和计算机应用科字等专业的本科生、研究生以及科技人员参考。

    标签: 语音处理 识别

    上传时间: 2013-08-04

    上传用户:Divine

  • 空管模拟训练中指令的语音识别与合成技术研究

    空中交通管制指令标准用语的训练是空管模拟训练中的重要内容。本文对空管模拟训练中指令的自动语音识别及自动语音合成应答问题进行了分析研究,包括:指令标准用语基本特征的分析,语言模型的文法设计,指令特殊发音的处理,多次应答的处理等,并基于开源语音识别引擎及语音合成引擎,设计并实现了一个语音指令识别及合成系统AIRSS. 系统实验数据分析表明,应答响应时间及语音合成的效果可以满足空管模拟训练的需求。

    标签: 模拟训练 指令 合成 技术研究

    上传时间: 2013-10-15

    上传用户:hzht