语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123
利用ARM处理器开发处理音频信号的设备很多,如移动电话、MD(MiniDisc),DVD播放器、MP3音频译码器等;同样,基于ARM处理器的网络设备也很多,如网络调制解调器、网络电脑、因特网设备等。但利用ARM处理器把语音处理和网络通信功能结合起来无疑是一种新的尝试,它的设计成功会给网络留言技术的开发提供一种新的思路。 本文通过一个ARM9芯片S3C2410作为处理器的嵌入式语音采集系统,详细阐述了嵌入式系统的设计与开发过程,其中包括: 交叉编译环境的搭建:交叉编译环境是嵌入式开发工具的集合,搭建该环境就是在系统中编译安装开发工具链。 操作系统内核的移植:这是嵌入式开发的主要单元之一,移植内核主要是对内核进行重新配置,使它符合特定系统的需要,然后重新编译生成可执行的内核镜像文件。 文件系统的移植:文件系统是操作系统对数据进行管理的有效和必要的助手。移植文件系统包括制作文件系统镜像、在Flash上为文件系统分配存储空间以及文件系统与嵌入式操作系统的有效配合。 驱动程序的设计:驱动是操作系统与硬件沟通的桥梁,驱动设计就是编写具体硬件的读写控制函数并向操作系统提供统一的接口。 本文更着重于介绍实际开发中使用的技术以及遇到的问题和解决方法。在第4章中结合语音芯片UDA1341TS阐述了语音数据的采集与处理;结合网卡控制芯片CS8900A阐述了网络通信和网卡的驱动,以及网络开发中遇到的问题和解决方法。
上传时间: 2013-07-11
上传用户:luopoguixiong
·论文摘要:利用声卡DSP技术和LabVIEW多线程技术,提出了一种基于声卡的数据采集与分析的廉价设计方案,具有实现简单、界面友好、性能稳定可靠等优点。在LabVIEW环境中实现了音频信号的采集分析及数据存盘重载。PC上配置多块声卡即可构成实时、高信噪比的多通道数据采集系统。可以推广到语音识别、环境噪声监测和实验室测量等多种领域,应用前景广阔。
上传时间: 2013-06-18
上传用户:changeboy
前的GPS导航应用很成熟,精度也比较高,但在地下停车场等室内地方,GPS信号非常微弱,无法对车进行导航,同时当前的地下停车场没有很好地智能化。为避免车主盲目寻找车位,方便车主在尽可能短的时间内寻找到车位,设计并制作基于nanoPAN5375的语音导航系统。系统由4个nanoPAN5375模块、2个CC1101模块、超声波模块与isd1700模块构成。以STM32F103微控制器为核心芯片,使用nanoPAN5375模块进行无线定位,CC1101模块传输超声波模块采集到的车位信息,语音模块isd1700进行语音导航,软件采用三边质心算法和卡尔曼滤波算法。实验表明,在边长为6米的等边三角形内,x坐标的平均误差为0.42米,y坐标的平均误差为0.42米;系统在边长为12米的等边三角形内实现过较为精确的语音导航。
上传时间: 2013-11-24
上传用户:zhang97080564
电子看版广泛的应用到工业生产领域,文中介绍了一种新型基于arm嵌入式的工业电子看板。和传统的电子看板系统相比,增加了刷卡认证、视频监控、语音通话。其中语音通话增强现场的管理,并能实现广播,给现场人员提供实时培训等功能。语音系统包括上位机及嵌入式两部分组成,语音采用adpcm进行压缩并通过wifi传输,通过测试语音输出清晰、没有延迟。
上传时间: 2013-10-30
上传用户:一诺88
基于51MCU的IDE硬盘语音记录器.是使用AT89C52 2个51 MCU制作的语音记录器,在系统中不需要地址锁存器,也不需要译码器。系统设计有IDE接口,128*64 LCD接口,红外遥控,语音声卡接口。
上传时间: 2015-05-03
上传用户:huangld
一个使用tapi实现的自动语音应答的例子,在tap2.1,阿尔卡特oxo交换机下运行良好。
上传时间: 2013-12-27
上传用户:nanxia
在FPGA上实现声卡接口,电子琴,滤波比较器,最终实现语音通信
上传时间: 2016-10-21
上传用户:海陆空653
LD3320芯片语音模块资料包括LD3320芯片设计论文+STM32单片机软件驱动代码:LD3320并行串行读写辅助说明.pdfLD3320开发手册.pdfLD3320数据手册.pdf其他共享配套参考程序模块介绍、应用提高语音识别技术论文资料MSP430 源程序.zip凌阳单片机部分程序.c基于STM32 的 LD3320基本驱动程序.zip官方开发板配套程序官方开发板配套程序.zip语音识别 AVR参考.zip语音识别模块 STM32+SD卡+LD3320工程.zip
上传时间: 2021-11-09
上传用户:
ISO-15693 识别卡,无触点的集成电路卡 第2部分
上传时间: 2013-07-27
上传用户:eeworm