虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

语音识别技术

语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
  • 基于zigbee的语音通信技术

    ZigBee 是一种低功耗、低成本的新型短距离无线通信开放性技术标准。它工作频段灵活,使用的频段分别为2. 4 GHz 、868 MHz (欧洲) 及915 MHz (美国) ,均为免执照频段; 传输速率为250 kbps , 有效传输距离为10 ~75 m。通过在发射端加功率放大器还可以实现更远距离的通信。 ZigBee 技术的低成本、低功耗特点,使其广泛地应用到库存管理、产品质量控制、工业过程控制、灾害地区监测、生物监测和监督、定位及消防安全等领域。虽然实现语音通信不是ZigBee 联盟最初的目标,但是,在许多领域(如消防抢险) 中没有语音通信功能,将使其应用受到很大的局限。本文正是考虑到这一点,并考虑到ZigBee 理论通信速率为250 kps ,实际速率也能满足语音通信要求的情况,充分利用本方案所选的MCU 的性能特性,以及很少的外围器件,很好地实现了语音通信。

    标签: zigbee 语音 通信技术

    上传时间: 2013-11-18

    上传用户:wangdean1101

  • 语音处理与识别_胡光锐 【语言】:中文 【页数】: 332 【何人(公司)所著】: 胡光锐 【文件格式】: PDF 【文件原名】: print 语音处理与识别_胡光锐 【摘要或目录】

    语音处理与识别_胡光锐 【语言】:中文 【页数】: 332 【何人(公司)所著】: 胡光锐 【文件格式】: PDF 【文件原名】: print 语音处理与识别_胡光锐 【摘要或目录】: 1语音信号数字处理基础 2语音信号时域处理方法 3语音波形的数字编码 4短时傅里叶分析方法 5语音信号的同态处理 6语音信号的线性预测编码 7语音识别方法与系统 8语音处理与识别的其他方法

    标签: print 332 语音处理

    上传时间: 2013-12-21

    上传用户:zhengzg

  • 语音芯片 SYN6288 数据手册

    SYN6288中文语音合成芯片数据手册第4页/共39页2010年5月12日更新1.概述SYN6288中文语音合成芯片是北京宇音天下科技有限公司于2010年初推出的一款性/价比更高,效果更自然的一款中高端语音合成芯片。SYN6288通过异步串口(UART)通讯方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。宇音天下于2002年最早研制出国内首款语音合成芯片OSYNO6188。公司最新推出的SYN6288语音合成芯片,继承了OSYNO6188语音芯片的优秀特点:最小SSOP28L贴片封装、硬件接口简单、低功耗、音色清亮圆润、极高的性/价比;除此之外,SYN6288在识别文本/数字/字符串更智能、更准确,语音合成自然度更好、可懂度更高。SYN6288语音合成效果和智能化程度均得到大幅度提高,是一款真正面向中高端行业应用领域的中文语音合成芯片。SYN6288语音合成芯片的诞生,将推动TTS语音合成技术的行业应用走向更深入、更广泛!

    标签: 语音

    上传时间: 2015-02-14

    上传用户:cylsds

  • 基于MATLAB的特定人语音识别算法设计

    通过MATLAB平台建立一个GUI界面,接着对一组语音信号的输入进行预处理及端点检测,提取特征参数(MFCC),形成参考模块。然后再对一组相同的语音信号输入进行同样的操作作为测试模块,与参考模块进行DTW算法进行匹配,输出匹配后的识别结果。

    标签: MATLAB 语音识别 算法设计

    上传时间: 2016-06-15

    上传用户:sjr88

  • RFID NFC 13.56MHz天线设计射频识别天线技术资料大全

    13.56MHz天线设计.pdf13.56M设计规范.pdf8-M1卡的安全问题及华东师大的应对策略.pdf8.6 谐振电路的品质因数.pptDES&RSA.pptDismantling MIFARE Classic.pdfht-ide3000.pdfMSP430 单片机与CPU 卡接口函数设计.pdfRC500-FM1702XX比较.pdfRC500天线设计资料RFID天线研究与设计.pdfRFID技术和防冲撞算法.pdfRFID电子标签防碰撞算法的研究.pdfRFID读写器天线的研究与设计.pdfRFID防碰撞技术的研究.pdf一种新颖的RFID防冲突算法.pdf低功耗无磁水表中射频卡读写器的设计.pdf基于MF RC500的RFID读写器的天线及匹配电路设计.doc基于TRF7960 读写器硬件部分设计中应注意的地方.pdf射频识别技术防碰撞算法的研究.pdf射频识别系统中的防碰撞算法设计.pdf无源电子标签读卡器防冲突检测及天线设计.pdf时隙ALOHA法在RFID系统防碰撞问题中的应用.pdf设计MF RC500 的匹配电路和天线的应用指南.pdf超高频RFID无线接口标准ISO_IEC18000_6C的研究.pdf近耦合射频识别系统的工作原理及天线设计.pdf远距离RFID天线设计.doc阻抗匹配.doc高速和资源节约型数据加密算法设计.pdf

    标签: rfid nfc 天线 射频识别

    上传时间: 2021-11-08

    上传用户:

  • 情感虚拟人技术在人机交互中的应用研究

    情感识别是机器通过识别和理解过程把人类的语音、表情和肢体语言中的情感信息识别出来。情感交互是机器通过接收人类的情感信息来模拟人类的情感决策过程,从而表达出自身情感的过程。本文的主要目标是把虚拟人技术应用到人机交互中,研究出具有情感识别功能和情感表达功能的机器。本文的具体工作和贡献包括:第一,详细描述虚拟人的三维模型和情感模型的建立过程。这里介绍了虚拟人实体的建立和控制,以及虚拟人的情感计算模型和情感决策机制。利用三维建模工具和游戏制作软件,来建立虚拟人和虚拟场景,并通过对虚拟人控制模块的设定来驱动虚拟人的动作和行为特点,这使虚拟人能够从行为上表达情感。虚拟人的情感模型是虚拟人情感计算和决策的关键,是虚拟人具有情感能力的基础。这里主要工作就是通过模拟人的情感计算过程和决策机制,来建立虚拟人的情感工作机制,从而控制虚拟人的情感计算过程,使虚拟人具有模拟人的情感表达的能力。第二,通过分析情感语音信号,来识别情感语音信号中的参数信息,并进一步识别出情感语音信号中的情感信息。语音信号中的参数有多种,本文在比较和总结的基础上,选定了三种参数来综合的识别语音信号中的情感信息。在情感语音语料库的基础上建立了情感特征参数数据库,这个数据库的主要是建立特征参数的参数模型,为情感识别建立识别基础。第三,利用隐马尔科夫模型算法在语音信号识别上的优点,来对情感语音信号进行情感信息的识别。情感信息与语言信息有共同的声学特征,只是二者反映的信息不同。通过情感语音信号的特征分析和理论验证,隐马尔科夫模型是一个理想的选择。实验证明,隐马尔科夫模型在情感信息的识别上,表现出很好的识别效果和较高的识别率,为隐马尔科夫模型的应用提供了事实支持。第四,建立人机交互系统原型,通过对整个系统进行测试和验证,来证明人机情感交互的可行性和科学性。验证主要通过情感识别和情感决策两方面进行,情感识别的主要是建立在情感语音识别的基础上,情感决策就是通过验证虚拟人情感表达的结果跟期望值的对比结果。

    标签: 情感虚拟人技术 人机交互

    上传时间: 2022-06-18

    上传用户:jiabin

  • 超高频射频识别标签基准测试研究.rar

    射频识别(Radio Frequency Identification,RFID)是一种允许非接触式数据采集的自动识别技术。其中工作在超高频(Ultra High Frequency,UHF)频段的无源RFID系统,由于在物流与供应链管理等领域的潜在应用,近年来得到了人们的广泛关注。这种系统所使用的无源标签具有识别距离长、体积小、成本低廉等突出特点。目前在市场上出现了各种品牌型号的UHF RFID无源标签,由于不同品牌型号的标签在设计与制造工艺上的差异,这些标签在性能表现上各不相同,这就给终端用户选择合适自己应用的标签带来了困难。RFID基准测试就是在实际部署RFID系统前对RFID标签的性能进行科学评估的有效手段。然而为了在常规实验室条件下得到准确公正的测试结果,需要对基准测试的性能指标及测试方法学开展进一步的研究。本文正是研究符合EPC Class1 Gen2标准的RFID标签基准测试。 本文首先分析了当前广泛应用的超高频无源RFID标签基准测试性能指标与测试方法上的局限性与不足之处。例如,在真实的应用环境中,由于受到各种环境因素的影响,对同一品牌型号的标签,很难得到一致的识读距离测试结果。另外,在某些测试场景中,使用识读速率作为测试指标,所得到的测试结果数值非常接近,以致分辨度不足以区分不同品牌型号标签的性能差异。在这些分析基础上,本文把路径损耗引入了RFID基准测试,通过有限点的测量与数据拟合分别得到不同类型标签的路径损耗方程,结合读写器天线的辐射方向图,进一步得到各种标签受限于读写器接收灵敏度的覆盖区域。无源标签由于其被动式能量获取方式,其实际工作区域仍然受限于前向链路。本文通过实验测试出这些标签的最小激活功率后,得出了各种标签在一定读写器发射功率下的激活区域。完成这些步骤后,根据这两种区域的交集可以确定标签的工作区域,从而进行标签间的比较并达到基准测试的目的,并能找出限制标签工作范围的瓶颈。 本文最后从功率损耗的角度研究了标签之间的相互干扰,为用户在密集部署RFID标签的场景中设置标签之间的最小间隔距离具有重要的参考意义。

    标签: 超高频 射频识别 基准测试

    上传时间: 2013-04-24

    上传用户:hbsunhui

  • 基于FPGA的语音增强算法研究与实现.rar

    现实生活中的语音不可避免的要受到周围环境的影响,背景噪声例如机械噪声、街头音乐噪音,其他说话者的话音等均会严重地影响语音信号的质量:此外传输系统本身也会产生各种噪声,因此接收端的信号为带噪语音信号。混叠在语音信号中的噪声按类别可分为环境噪声等的加法性噪声及电器线路干扰等的乘法性噪声;按性质可分为平稳噪声和非平稳噪声。 语音增强的根本目的就是净化语音质量。把不需要的噪音减低到最小程度。但是由于噪音的复杂性,很难归纳出一个统一的特征,因此不可能寻求一种算法完全适应于所有的噪音消除,因此语音增强是一个复杂的工程。 有关抗噪声技术的研究以及实际环境下的语音信号处理系统的开发,在国内外已经成为语音信号处理非常重要的研究课题,已经作了大量的研究工作,取得了丰富的研究成果。本文仅对加性噪声下的语音增强技术做了较为仔细的讨论,我们先给出语音信号处理的基本理论,它是语音增强算法研究和实现的理论基础,在此基础总结了自适应信号处理技术的特点以及在语音增强方面的应用。选取工程领域最常用的自适应LMS滤波算法和RLS滤波算法作为研究对象,提出了利用最小均方误差意义下自适应滤波器的输出信号与主通道噪声信号的等效关系,得到滤波器最佳自适应参数的方法,并分析了在平稳和非平稳噪声环境下,L M S滤波器族和R L S滤波器在不同噪音输入下的权系数收敛速度、权系数稳定性、跟踪输入信号的能力和信噪比的改善等特性。 研究了MATLAB语言程序设计和使用MALTLAB对语音算法进行仿真、并输入了多种实际环境下的噪音进行滤波仿真并对仿真的结果进行比较和分析。总结出了LMS、NLMS、SIGN-ERROR-LMS、RLS自适应滤波器在语音滤波方面的特点 和应用情况。 最后在MATLAB仿真的基础上,利用Altera公司的Cyclone2系列FPGA芯片和多种EDA工具,完成了L M S自适应滤波器的FPGA设计。 关键词:语音增强,背景噪音,自适应滤波器,LMS,RLS,FPGA

    标签: FPGA 语音增强 算法研究

    上传时间: 2013-04-24

    上传用户:lijianyu172

  • 基于DSP实现G729语音编码算法.rar

    高速发展的DSP技术为语音信号处理领域提供了良好的发展平台,使得实时实现各种复杂的算法称为可能。G.729语音编码是国际电信联盟(ITU-T)于1996年获准通过的采用共轭结构代数码激励线性预测技术的具有8 kbit/s码速率的语音算法建议,广泛应用于数字移动通信、IP电话和数字卫星通信中。本文研究了G.729语音编码原理和在TMS320C5416定点DSP芯片上实时实现该编码器过程中的软、硬件设计。主要涉及有以下几方面内容: 1.介绍语音编码技术和DSP技术的发展概况。 2.研究了基于CELP结构的G.729编码的算法原理。 3.根据G.729声码器实时实现的需要,介绍硬件平台的组成,研究了系统软件的设计和基于算法和实时需要的软件优化。 4.利用DSP代码调试工具对系统性能进行分析,得出测试结果。

    标签: G729 DSP 语音编码

    上传时间: 2013-07-11

    上传用户:woshiayin

  • 智能人脸识别算法及其FPGA的实现.rar

    人脸自动识别技术是模式识别、图像处理等学科的一个最热门研究课题之一。随着社会的发展,各方面对快速有效的自动身份验证的要求日益迫切,而人脸识别技术作为各种生物识别技术中最重要的方法之一,已经越来越多的受到重视。对于具有实时,快捷,低误识率的高性能算法以及对算法硬件加速的研究也逐渐展开。 本文详细分析了智能人脸识别算法原理,发展概况和前景,包括人脸检测算法,人眼定位算法,预处理算法,PCA和ICA 算法,详细分析了项目情况,系统划分,软硬件平台的资源和使用。并在ISE软件平台上,用硬件描述语言(verilog HDL)对算法部分严格按照FPGA代码风格进行了RTL 硬件建模,并对C++算法进行了优化处理,通过仿真与软件算法结果进行比对,评估误差,最后在VirtexII Pro FPGA 上进行了综合实现。 主要研究内容如下: 首先,对硬件平台xilinx的VirtexII Pro FPGA 上的系统资源进行了描述和研究,对存储器sdram,RS-232 串口,JTAG 进行了研究和调试,对Coreconnect的OPB总线仲裁机理进行了两种算法的比较,RTL 设计,仿真和综合。利用ISE和VC++软件平台,对verilog和C++算法进行同步比较测试,使每步算法对应正确的结果。对软硬件平台的合理使用使得在项目中能尽可能多的充分利用硬件资源,制板时正确选型,以及加快设计和调试进度。其次,对人脸识别算法流程中的人脸检测,人眼定位,预处理,识别算法分别进行了比较研究,选取其中各自性能最好的一种算法对其原理进行了分析讨论。人脸检测采用adaboost 算法,因其速度和精度的综合性能表现优异。人眼定位采用小块合并算法,因为它具有快速,准确,弱时实的特点。预处理算法采用直方图均衡加平滑的算法,简单,高效。 识别算法采用PCA 加ICA 算法,它能最大的弱化姿态和光照对人脸识别的影响。 最后,使用Verilog HDL 硬件描述语言进行算法的RTL 建模,在C++算法的基础上,保证原来效果的前提下,根据FPGA 硬件特点对算法进行了优化。视频输入输出是人脸识别的前提,它提供FPGA 上算法需要处理的数据,预处理算法在C++算法的基础上进行了优化,最大的减少了运算量,提高了运算速度,16 位计算器模块使得在算法实现时可以根据系统要求,在FPGA的ip 核和自己设计的模块之间选择性能更好的一个来调用,FIFO的设计提供同步和异步时钟域的数据缓存。设计在ISE和VC++软件平台同时进行,随时对verilog和C++数据进行监测和比对。全部设计模块通过仿真,达到预定的性能要求,并在FPGA 上综合实现。

    标签: FPGA 人脸识别 算法

    上传时间: 2013-07-13

    上传用户:李梦晗