语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123
随着语音技术应用的发展,语音信号数字处理的实时性要求越来越突出。这就要求在系统设计中,对系统的硬件环境要求更高。随着语音处理算法的日益复杂,用普通处理器对语音信号进行实时处理,已经不能满足需要。专用语音信号处理芯片能解决实时性的要求,同时对器件的资源要求也是最低的。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对语音信号的常用参数—LPC(线性预测编码,Linear Predictive Coding)参数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音的离散数学模型和短时平稳特性进行了分析,深入讨论了语音线性预测技术。第二,对解线性预测方程组的自相关法和协方差斜格法进行了比较,提出了一种基于协方差斜格法的LPC参数提取系统的总体设计方案。第三,对Altera公司的Cyclon系列可编程器件的内部结构进行了研究,分析了在QuartusⅡ开发平台上进行FPGA设计的流程。第四,对系统的各个功能模块进行了设计,所有算法通过Verilog硬件描述语言实现,并对其工作过程进行了详细的分析。最后,在Altera FPGA目标芯片EP1C6Q240C8上,对LPC参数提取系统进行了仿真验证。 系统具有灵活的输入输出接口,能方便地同其它语音处理模块相连,构成一个完整的语音处理专用芯片,可以应用于语音编解码、语音识别等系统。
上传时间: 2013-04-24
上传用户:TI初学者
·详细说明:在Matlab上实现的特定人小词汇量的语音识别程序。先输入10个模板,第10个为退出命令,然后再根据提示进行识别.文件列表: recognize.m rec_base_file.m rec_base_file_once.m
上传时间: 2013-04-24
上传用户:121212121212
提出了一种基于仿生小波变换和模糊推理的变步长自适应滤波语音降噪算法。该算法首先用仿生小波变换法对包含噪声的语音信号进行小波分解,以分离出来的噪声信号作为自适应滤波器的输入,选择基于模糊推理变步长自适应算法对带噪声语音信号进行降噪处理,最终实现语音信号的信噪分离,去除语音信号中的噪声。仿真结果表明,该方法对语音信号有较为明显的降噪效果。
上传时间: 2013-10-14
上传用户:恋天使569
利用TPM2定时器产生一通道语音信号输出,语音数据为PCM格式:PCM的概念脉冲编码调制(Pulse Code Modulation,PCM)是概念上最简单、理论上最完善的编码系统,是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。PCM的编码原理比较直观和简单,它的原理框图如图1-1所示。在这个编码框图中,它的输入是模拟声音信号,它的输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”,“量化器”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。
上传时间: 2013-11-21
上传用户:DXM35
运用TI提供codec驱动程序来实现语音数据处理,使用FIR算法处理输入的语音数据,和控制输出增益。
上传时间: 2015-05-22
上传用户:lmeeworm
语音PCM编码,从输入,在高斯白噪声下传输到译码
上传时间: 2013-12-28
上传用户:eclipse
G726局域网语音通话源代码 这是使用G726语音压缩(16kbps)和RTP进行传输的程序,使用方法很简单,因为没多少时间,并且RTP不面向连接,所以我也没做连接确认的,只用两端各自输入对方的IP,然后按下“开始对话”,就可以进行语音通信了。
上传时间: 2015-08-22
上传用户:gundamwzc
基于微软的语音控制开发应用,可以控制多个程序 原理是模拟键盘的输入指令
上传时间: 2014-01-26
上传用户:yyyyyyyyyy
基于微软的语音控制开发应用,可以控制多个程序 原理是模拟键盘的输入指令
上传时间: 2015-09-14
上传用户:wcl168881111111