语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
上传时间: 2017-05-05
上传用户:kiklkook
使用高斯模型对威斯康辛州大学医学院长期乳腺癌数据进行了贝叶斯模式识别。识别率为95以上,可以作为模式识别的重要案例。
上传时间: 2013-12-27
上传用户:叶山豪
Visual C++数字图像模式识别技术及工程实践(随书光盘)人民邮电出版社2003张宏林本书介绍了模式识别和人工智能中的一些基本理论以及一些相关的模型,包括贝叶斯决策、线性判别函数、神经网络理论、隐马尔可夫模型、聚类技术等,同时结合模式识别中的一些经典问题,从多种不同的角度介绍了这些问题的解决思路。
上传时间: 2017-07-01
上传用户:netwolf
利用几何成像原理建立起CCD 双目立体视觉测量系统的数学模型,从提高系统测 量精度出发,在理论上重点对系统结构参数、图像识别误差与系统测量精度的关系进行了深入的分析和探讨,并通过实验对结论进行了验证。研究内容对实际建立该测量系统具有很强的指导作用。
上传时间: 2017-07-02
上传用户:watch100
一个学习自然场景类别的贝叶斯模型、基于“词袋”模型的目标分类。来源于Feifei Li的论文。是近年来的目标识别模型热点之一。
上传时间: 2013-12-26
上传用户:1051290259
本篇论文从常用语音特征参量的提取、基于矢量量化和混合高斯模型的说话 人识别、识别方法的优化及系统实现与实验结果这几个方面讨论了说话人识别的 应用技术,并对实验结果进行了讨论
上传时间: 2014-12-19
上传用户:mikesering
本文对家用电器中语音识别技术的DSP实现进行了研究。文章介绍了语音识别技术的基本概念,讨论了语音识别系统的组成和实现的技术;详细分析了构成语音识别系统的四个组成部分,包括语音信号数字化与预处理、语音的端点检测、特征提取与模式匹配。着重介绍了实现端点检测的短时平均能量与短时平均过零率分析,语音信号的线性预测分析及在此基础之上的倒谱特征参数,以及实现模式匹配的常用的矢量量化技术、动态时间规整技术和隐马尔可夫模型;根据提出的语音识别系统的构成,介绍了在MATLAB6.5上实现了采用动态时间规整算法的识别系统的仿真分析。
上传时间: 2013-04-24
上传用户:zwei41
近年来,语音识别研究大部分集中在算法设计和改进等方面,而随着半导体技术的高速发展,集成电路规模的不断增大与各种研发技术水平的不断提高,新的硬件平台的推出,语音识别实现平台有了更多的选择。语音识别技术在与DSP、FPGA、ASIC等器件为平台的嵌入式系统结合后,逐渐向实用化、小型化方向发展。 本课题通过对现有各种语音特征参数与孤立词语音识别模型进行研究的基础上,重点探索基于动态时间规整算法的DTW模型在孤立词语音识别领域的应用,并结合基于FPGA的SOPC系统,在嵌入式平台上实现具有较好精度与速度的孤立词语音识别系统。 本系统整体设计基于DE2开发平台,采用基于Nios II的SOPC技术。采用这种解决方案的优点是实现了片上系统,减少了系统的物理体积和总体功耗;同时系统控制核心都在FPGA内部实现,可以极为方便地更新和升级系统,大大地提高了系统的通用性和可维护性。 此外,由于本系统需要大量的高速数据运算,在设计中作者充分利用了Cyclone II芯片的丰富的硬件乘法器,实现了语音信号的端点检测模块,FFT快速傅立叶变换模块,DCT离散余弦变换模块等硬件设计模块。为了提高系统的整体性能,作者充分利用了FPGA的高速并行的优势,以及配套开发环境中的Avalon总线自定义硬件外设,使系统处理数字信号的能力大大提高,其性能优于传统的微控制器和普通DSP芯片。 本论文主要包含了以下几个方面: (1)结合ALTERA CYCLONE II芯片的特点,确定了基于FPGA语音识别系统的总体设计,在此基础上进行了系统的软硬件的选择和设计。 (2)自主设计了纯硬件描述语言的驱动电路设计,完成了高速语音采集的工作,并且对存储数据芯片SRAM中的原始语音数据进行提取导入MATLAB平台测试数据的正确性。整个程序测试的方式对系统的模块测试起到重要的作用。 (3)完成高速定点256点的FFT模块的设计,此模块是系统成败的关键,实现高速实时的运算。 (4)结合SOPC的特性,设计了人机友好接口,如LCD显示屏的提示反馈信息等等,以及利用ALTERA提供的一些驱动接口设计完成用户定制的系统。 (5)进行了整体系统测试,系统可以较稳定地实现实时处理的目的,具有一定的市场潜在价值。
上传时间: 2013-05-23
上传用户:ABCD_ABCD
语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123
嵌入式人脸识别系统建立在嵌入式操作系统和嵌入式硬件系统平台之上,具有起点高、概念新、实用性强等特点。它涉及嵌入式硬件设计、嵌入式操作系统应用开发、人脸识别算法等领域的研究;嵌入式人脸识别系统携带方便、安装快捷、机动性强,可广泛应用于各类门禁系统、户外机动布控的实时监测等特殊场合,因此对嵌入式人脸识别的研究工作具有突出的理论意义和广泛的应用前景。 本文是上海市经委创新研究项目《射频识别RFID系统-自动识别和记录人群的身份》(编号:04-11-2)与上海市科委AM基金项目《基于ARM和RFID芯片的自组织安全监控系统的研制》(编号:0512)的主要研究内容之一。论文从构建自动人脸识别系统所需解决的若干关键问题入手,重点探讨了基于嵌入式ARM微处理器的实时人脸检测、关键特征定位、高效的人脸特征描述、鲁棒的人脸识别分类器及自动人脸识别系统设计等问题的研究。论文的主要工作和创新点表现在以下方面: 1实现了结合肤色校验的Haar特征级联分类器嵌入式实时人脸检测,提出了基于人脸约束的人眼Haar特征RSVM级联分类器人眼检测算法和基于遮罩掩磨与椭圆拟合的瞳孔定位算法。 复杂背景中的人脸检测是自动人脸识别系统首先要解决的关键问题,通过对基于肤色模型和基于Haar特征级联强分类器的人脸检测算法的分析研究,综合两个算法的优点,提出了基于肤色模型校验和Haar特征级联强分类器的嵌入式实时人脸检测算法。实验结果表明,该算法不仅解决了复杂背景中的类肤色和类人脸结构问题,而且具有较高的检测率和较快的检测速度,同时对光照、尺度等变化条件下的人脸检测也具有较强的鲁棒性。 人眼检测与瞳孔定位在人脸归一化和有效人脸特征抽取等方面起着非常重要的作用,为了快速检测人眼并精确定位人眼瞳孔中心,论文提出了基于人脸约束的人眼Haar特征RSVM级联分类器人眼检测算法和基于遮罩掩磨与椭圆拟合的瞳孔定位算法,首先利用人眼检测分类器在人脸区域内完成对人眼位置的检测,然后通过对检测到的人眼进行遮罩掩磨、简单图像形态学变换及椭圆拟合实现瞳孔中心的精确定位。测试结果表明该算法只需几百毫秒便能完成人眼检测与瞳孔中心定位整个过程,在保证检测速度较快的同时,还能确保较高的定位精度。 2 针对传统线性判别分析法存在的小样本问题(sss),通过调整Fisher判别准则,实现了自适应线性判别分析算法及相应的人脸识别方法人脸识别中的小样本问题使线性判别分析算法的类内散布矩阵发生严重退化,导致问题无法求解。本文在人脸识别小样本问题的基础上,通过调整Fisher判别准则,利用类间散布矩阵的补空间巧妙地避开类内散布矩阵的求逆运算,通过训练集每类样本的样本数信息自适应改变调整参数,实现了自适应线性判别分析算法,实验结果表明,该算法能有效解决人脸识别中的小样本问题。 3 提出了基于有效人脸区域的Gabor特征抽取算法,有效地解决了Gabor特征抽取维数过高的问题。 Gabor小波对图像的光照、尺度变化具有较强鲁棒性,是一种良好的人脸特征表征方法。但维数过高的Gabor特征造成应用系统的维数灾难,为解决Gabor特征的维数灾难问题,论文第四章提出了基于有效人脸区域的Gabor特征抽取算法,该算法不仅有效地降低了人脸特征向量维数,缩小了人脸特征库的规模,同时降低了核心算法的时间和空间复杂度,而且具有与传统Gabor特征抽取算法同样的鲁棒性。 4 结合有效人脸区域的Gabor特征抽取、自适应线性判别分析算法和基于支持向量机分类策略,提出并实现了基于支持向量机的嵌入式人脸识别和嵌入式人像比对系统支持向量机通过引入核技巧对训练样本进行学习构造最小化错分风险的最优分类超平面,不仅具有强大的非线性和高维处理能力,而且具有更强的泛化能力。本文研究了支持向量机的多类分类策略和训练方法,并结合论文中提出的基于有效人脸区域的Gabor特征提取算法、自适应线性判别分析算法,首次在基于Windows CE操作系统的嵌入式ARM平台中实现了具有较强鲁棒性的嵌入式自动人脸识别系统和嵌入式人像比对系统。 5 提出并初步实现了基于客户机/服务器结构无线网络模型的远距离人脸识别方案为解决嵌入式人脸识别系统在海量人脸库中进行识别的难题,论文提出并初步实现了基于客户机/服务器结构无线网络模型的嵌入式远距离人脸识别方案。 客户机(嵌入式平台)完成对人脸图像的检测、归一化处理和人脸特征提取,然后通过无线网络将提取后的人脸特征数据传输到服务器端,由服务器在海量人脸库中完成人脸识别,并将识别后的结果通过无线网络传输到客户机显示输出,从而实现基于客户机/服务器无线网络模型的嵌入式远距离人脸识别方案。 6 结合我们开发的基于ARM的嵌入式自动人脸识别系统和嵌入式人像比对系统,从系统设计的角度探讨了在嵌入式系统中进行人脸识别应用设计的思路及应该注意的问题虽然嵌入式人脸识别系统的性能很大程度上取决于高效的人脸特征描述和鲁棒的人脸识别核心算法。但是,嵌入式系统的设计思想对嵌入式人脸识别系统的性能影响同样值得重视。本文第六章重点阐述了嵌入式自动人脸识别应用系统的设计思路,并结合我们自主开发的嵌入式自动人脸识别系统和嵌入式人像比对系统从系统设计的角度探讨了嵌入式人脸识别应用系统设计中应该注意的关键技术问题。 结合本文提出的算法我们在PC上完成对人脸识别分类器的训练,然后在嵌入式ARM开发平台上实现了嵌入式自动人脸识别、嵌入式人像比对两个便携式人员身份认证系统,经测试运行效果良好。所提出的人脸识别算法不仅具有一定的理论参考价值,而且对于嵌入式系统应用开发、AFR应用系统开发也具有一定的借鉴意义。
上传时间: 2013-05-18
上传用户:我们的船长