现实生活中的语音不可避免的要受到周围环境的影响,背景噪声例如机械噪声、街头音乐噪音,其他说话者的话音等均会严重地影响语音信号的质量:此外传输系统本身也会产生各种噪声,因此接收端的信号为带噪语音信号。混叠在语音信号中的噪声按类别可分为环境噪声等的加法性噪声及电器线路干扰等的乘法性噪声;按性质可分为平稳噪声和非平稳噪声。 语音增强的根本目的就是净化语音质量。把不需要的噪音减低到最小程度。但是由于噪音的复杂性,很难归纳出一个统一的特征,因此不可能寻求一种算法完全适应于所有的噪音消除,因此语音增强是一个复杂的工程。 有关抗噪声技术的研究以及实际环境下的语音信号处理系统的开发,在国内外已经成为语音信号处理非常重要的研究课题,已经作了大量的研究工作,取得了丰富的研究成果。本文仅对加性噪声下的语音增强技术做了较为仔细的讨论,我们先给出语音信号处理的基本理论,它是语音增强算法研究和实现的理论基础,在此基础总结了自适应信号处理技术的特点以及在语音增强方面的应用。选取工程领域最常用的自适应LMS滤波算法和RLS滤波算法作为研究对象,提出了利用最小均方误差意义下自适应滤波器的输出信号与主通道噪声信号的等效关系,得到滤波器最佳自适应参数的方法,并分析了在平稳和非平稳噪声环境下,L M S滤波器族和R L S滤波器在不同噪音输入下的权系数收敛速度、权系数稳定性、跟踪输入信号的能力和信噪比的改善等特性。 研究了MATLAB语言程序设计和使用MALTLAB对语音算法进行仿真、并输入了多种实际环境下的噪音进行滤波仿真并对仿真的结果进行比较和分析。总结出了LMS、NLMS、SIGN-ERROR-LMS、RLS自适应滤波器在语音滤波方面的特点 和应用情况。 最后在MATLAB仿真的基础上,利用Altera公司的Cyclone2系列FPGA芯片和多种EDA工具,完成了L M S自适应滤波器的FPGA设计。 关键词:语音增强,背景噪音,自适应滤波器,LMS,RLS,FPGA
上传时间: 2013-04-24
上传用户:lijianyu172
在实际工作现场,常常需要在一个非常恶劣的环境中进行通话,随着CAN总线在工业生产的应用越来越广泛,想到了把CAN总线应用于电话通信上来.CAN总线具有极高的总线利用率,这有可能使得我们只需要用两根CAN总线,就可以把需要通话的节点电话连接起来,从而实现语音通信. 本文主要论述了基于CAN总线的多节点语音通信系统设计.该系统使用MC14LC5480作为语音采集编解码器,AT90CAN128作为处理器,使用处理器自带的CAN模块实现多个CAN节点间的通信,最终达到实现多节点间语音通信的功能. 本文的前半部分介绍了CAN总线技术和语音信号的数字处理技术,评价了用CAN总线传输语音信号的优点.本文后半部分详细介绍了该系统的硬件结构和软件设计,通过分析系统所涉及的芯片对该系统的各个功能模块做了详细的说明,包括语音编解码电路,语音数字信号处理电路,CAN总线传输电路等.通过该系统,能够实现在实验室条件下多个CAN节点间的语音通信.
上传时间: 2013-04-24
上传用户:mingaili888
高速发展的DSP技术为语音信号处理领域提供了良好的发展平台,使得实时实现各种复杂的算法称为可能。G.729语音编码是国际电信联盟(ITU-T)于1996年获准通过的采用共轭结构代数码激励线性预测技术的具有8 kbit/s码速率的语音算法建议,广泛应用于数字移动通信、IP电话和数字卫星通信中。本文研究了G.729语音编码原理和在TMS320C5416定点DSP芯片上实时实现该编码器过程中的软、硬件设计。主要涉及有以下几方面内容: 1.介绍语音编码技术和DSP技术的发展概况。 2.研究了基于CELP结构的G.729编码的算法原理。 3.根据G.729声码器实时实现的需要,介绍硬件平台的组成,研究了系统软件的设计和基于算法和实时需要的软件优化。 4.利用DSP代码调试工具对系统性能进行分析,得出测试结果。
上传时间: 2013-07-11
上传用户:woshiayin
语音编码技术始终是语音研究的热点。语音编码作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视。G729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的,国际电信联盟(ITU-T)于1995年11月正式通过了G729。96年ITU-T又制定了G729的简化方案G729A,主要降低了计算的复杂度以便于实时实现。因其具有良好的合成语音质量、适中的复杂度、较低的时延等优点,G729A标准已被广泛应用在VOIP网关、IP电话中。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对G729A语音编码中的线性预测(LP)滤波器系数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音信号处理及其发展进行介绍,深入讨论了G729A语音编解码技术。第二,对Altera公司的Stratix系列可编程器件的内部结构进行了研究,分析了在QuartusII开发平台上进行FPGA设计的流程。第三,基于FPGA,对G729A编码系统的LP分析部分做了具体设计,其中包括自相关函数和杜宾(Durbin)递推两个主要功能模块,并对其工作过程进行了详细的分析。第四,针对系统所使用的除法运算都是商小于1的特点,设计并实现了一个系统专用的除法器模块。最后,在Altera FPGA目标芯片EP1S30F780C7上,对LP分析系统进行了验证,证明了方案的可行性。
上传时间: 2013-06-20
上传用户:pwcsoft
本文对G.729语音编码算法的基本原理和实现系统开发方面进行了深入研究。针对G.729语音编码算法在实际应用中存在的一些问题,在大量分析和实验的基础上,提出了新的改进算法。G.729语音编码算法硬件实现方面,国内外现在主要以DSP为实现平台,这是由于DSP以其卓越的运算能力为数字语音信号处理领域的研究及开发提供了有力的工具。但G.729语音编码算法具有计算复杂和数据存储量大的固有缺陷,随着通信量的不断增加和服务的扩展,对G.729语音编码实时性的要求也越来越高。随着微电子制造工艺的发展,越来越多的语音编码平台采用DSP与FPGA或MCU相互结合的系统,通过进行软硬件协同设计提高编码效率。
上传时间: 2013-06-30
上传用户:ccclll
随着通信、网络等技术的不断发展,对车内(机内)通话系统提出了更高的要求。本文以军用车内通话系统为主要应用背景,实现对现有车内通话系统的升级和改造,主要涉及系统结构、软件流程、相关接口及通信协议等内容。 早期模拟车内通话系统已经不能满足数字化建设的需要。现役的数字式车内通话系统普遍功能单一,不具备数据传输等功能。而且系统组成单体设备种类多、接口不统一、兼容性差,较难实现通用化设计。 本文提出一种基于ARM+DSP架构的多功能车内通话系统。主要由多个语音终端、一个主控盒以及头戴通信帽等硬件组成,最大可支持车内16个乘员之间通话,具有群呼、组呼、选呼、强呼、数据传输等功能,系统内乘员还可以通过主控盒与车外网络的用户进行通话或通信。 论文共分七章,主要内容包括:(1)车内通话系统的国内外发展现状和趋势;(2)语音终端系统设计,包括软硬件实现、通信协议等;(3)语音终端设计中几个关键技术的分析和研究。 本文设计的语音终端话音质量高,扩展功能强大,成本相对低廉,除适合在军用通信领域外,在商用领域也具有良好的市场前景。
上传时间: 2013-05-17
上传用户:TF2015
随着经济的发展,城市交通的压力越来越大,很多城市都开始建设地铁项目,发展地下轨道交通事业。在地铁列车上,驾驶员需要方便、快捷地控制各种语音功能,保障列车可靠、安全的运行,从而为乘客提供优质的服务。驾驶员语音控制器就是为了满足这一需求而提出来的。 在描述列车乘客信息系统的发展、介绍了公共广播系统的功能的之后,本文分析了驾驶员语音控制器的设计需求,设计了一种具有人机交互功能的驾驶员语音控制器。它带有LCD显示屏和输入键盘;能够在内部存储路线、站点和紧急信息等用户数据。通过窗口菜单以图形化的方式向驾驶员显示列车运行信息。通过通信端口,按照双方约定的通讯格式,将运行模式,路线站点,紧急信息等内容发送给列车显示与广播控制单元,完成语音及显示控制。根据需求分析,提出了一种基于ARM的控制器设计平台。设计了该控制器的硬件和软件的整体方案,采用模块化设计的思想给出了系统各主要模块的具体设计与实现方法,并给出了相关电路的实现原理图。最后介绍了本控制器的测试方法与过程,并给出了具体应用。该驾驶员语音控制器实现了人工广播、司机对讲、紧急对讲和系统设置等功能。具有操作方便、便于维护、可配置、成本低等优点,满足了驾驶员以及列车语音与显示控制的实际需求。关键词:ARM;RS485;乘客信息系统;图形用户界面;嵌入式系统
上传时间: 2013-07-30
上传用户:电子世界
能通过电话按键时的录音文件,采用离散傅立叶变换Goertzel算法,通过软件能够精确分析按键声音0-9、#、*的识别,通过最新技术和语音识别技术分析,能够完美的呈现出音频文件中电话号码发声的识别数字号码及按键顺序. 作者:小光 QQ:1512839549
上传时间: 2013-06-13
上传用户:gengxiaochao
能通过电话按键时的录音文件,采用离散傅立叶变换Goertzel算法,通过软件能够精确分析按键声音0-9、#、*的识别,通过最新技术和语音识别技术分析,能够完美的呈现出音频文件中电话号码发声的识别数字号码及按键顺序. 作者:小光 QQ:1512839549
上传时间: 2013-05-22
上传用户:baiom
语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123