虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

语音识别系统

语音识别系统的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的。
  • 基于模版匹配的车牌数字与字母识别

    基于模版匹配法在车牌识别方面的应用,具有较高的参考价值,但不涉及代码。代码实现请搜索基于Matlab的车票号码识别系统设计。

    标签: 模版匹配 车牌识别

    上传时间: 2021-12-17

    上传用户:

  • 嵌入式智能机器人平台研究

    嵌入式智能机器人平台研究摘 要:针对传统工业机器人采用的封闭式结构的局限性,在WindowsCE.NET系统基础上,通过剪裁定制 ,去 除冗余的功能,搭建嵌入式智能机器人平台.该智能机器人系统具有移动机器人需要的主要感知模块,并有丰富的 运动控制接口及驱动模块.同时 ,设计了多传感器数据融合 、轨迹规划、运动控制、无线网络通信 、图形人机界面等智 能机器人的测试软件和应用模块.该智能机器人平台具有模块化、易扩展、可移植、可定制、硬件体积小、功耗低、实 时性强、可靠性高等优点. 关键词:智能机器人平台;WindowsCE.NET;实时控制;自主机器人;双目视觉;语音识别引言(Introduction) 随着计算机技术 的快 速发展 ,机器 人技术也得 到了飞速发展.然而 ,现有机器人系统在硬件 和软件 开发方面虽然已经趋于成熟,但依然存在一些问题. 它们的硬件多是专用的,软件系统也多采用 Windows 2000或者 WindowsXP系统….这些机器人系统 主要 存在以下一些缺点 : (1)系统的实时性差.机器人控制系统是一个实 时性要求非常高的控制系统,作为一般桌面应用的 Windows和 Linux操作系统很难达到高实时性的要 求. . (2)开放性 以及扩展性差.常见的机器人控制系 统存在的一个 问题就是 系统 的冗余大、开放性扩展 基金项 目:国家 自然科学基金 资助项 目(60475036) 收稿 日期 :2005—05—16 性差,系统适用于特定的应用 ,不便于在硬件和软件 上进行扩展和剪裁. (3)软件的独立性差.软件结构及其逻辑结构依 赖于处理器硬件 ,难以在不同的系统 间移植. (4)缺少友好的人机交互界面. 2 系统概述(System description) 为促进当前智能机器人研究和应用,迫切需要 开发“具有开放式结构 的、模块化 、标准化 的嵌 入式 智能机器人平台”.这种智能机器人平台具

    标签: 嵌入式 智能机器人

    上传时间: 2022-02-12

    上传用户:zhaiyawei

  • 机器学习:人工神经网络

    人工神经网络提供了一种普遍且实用的方法从样例中学习值为实数、离散值或向量的函数反向传播算法,使用梯度下降来调节网络参数以最佳拟合由输入-输出对组成的训练集合人工神经网络对于训练数据中的错误健壮性很好人工神经网络已被成功应用到很多领域,例如视觉场景分析,语音识别,机器人控制神经网络学习对于逼近实数值、离散值或向量值的目标函数提供了一种健壮性很强的方法对于某些类型的问题,如学习解释复杂的现实世界中的传感器数据,人工神经网络是目前知道的最有效的学习方法反向传摇成功例子,学习识别手写字符,学习识别口语,学习识别人脸生物学动机ANN受到生物学的启发,生物的学习系统是由相互连接的神经元组成的异常复杂的网络。ANN由一系列简单的单元相互密集连接构成的,其中每一个单元有一定数量的实值输入,并产生单一的实数值输出人脑的构成,大约有1011个神经元,平均每一个与其他104个相连神经元的活性通常被通向其他神经元的连接激活或抑制最快的神经元转换时间比计算机慢很多,然而人脑能够以惊人的速度做出复杂度惊人的决策很多人推测,生物神经系统的信息处理能力一定得益于对分布在大量神经元上的信息表示的高度并行处理

    标签: 机器学习 神经网络

    上传时间: 2022-04-08

    上传用户:trh505

  • 基于树莓派的人脸识别系统

    本设计用树莓派实现人脸识别,主要用OPENCV实现该功能

    标签: 树莓派 人脸识别系统

    上传时间: 2022-06-09

    上传用户:

  • Matlab 深度学习简介

    MATLAB深度学习简介深度学习是机器学习的一个类型,该类型的模型直接从图像、文本或声音中学 习执行分类任务。通常使用神经网络架构实现深度学习。“深度”一词是指网络 中的层数 — 层数越多,网络越深。传统的神经网络只包含 2 层或 3 层, 而深度网络可能有几百层。下面只是深度学习发挥作用的几个例子:• 无人驾驶汽车在接近人行横道线时减速。• ATM 拒收假钞。• 智能手机应用程序即时翻译国外路标。深度学习特别适合鉴别应用场景,比如人脸辨识、 文本翻译、语音识别以及高级驾驶辅助系统(包括 车道分类和交通标志识别)。简言之,精确。先进的工具和技术极大改进了深度学习算法,达到了 很高的水平,在图像分类上能够超越人类,能打败世界最优秀的围棋 选手,还能实现语音控制助理功能,如 Amazon Echo® 和 Google Home,可用来查找和下载您喜欢的新歌。如果您刚接触深度学习,快速而轻松的入门方法是使用现有网络, 比如 AlexNet,用一百多万张图像训练好的 CNN。AlexNet 最常用于 图像分类。它可将图像划分为 1000 个不同的类别,包括键盘、鼠标、 铅笔和其他办公设备,以及各个品种的狗、猫、马和其他动物。

    标签: Matlab

    上传时间: 2022-06-10

    上传用户:

  • 情感虚拟人技术在人机交互中的应用研究

    情感识别是机器通过识别和理解过程把人类的语音、表情和肢体语言中的情感信息识别出来。情感交互是机器通过接收人类的情感信息来模拟人类的情感决策过程,从而表达出自身情感的过程。本文的主要目标是把虚拟人技术应用到人机交互中,研究出具有情感识别功能和情感表达功能的机器。本文的具体工作和贡献包括:第一,详细描述虚拟人的三维模型和情感模型的建立过程。这里介绍了虚拟人实体的建立和控制,以及虚拟人的情感计算模型和情感决策机制。利用三维建模工具和游戏制作软件,来建立虚拟人和虚拟场景,并通过对虚拟人控制模块的设定来驱动虚拟人的动作和行为特点,这使虚拟人能够从行为上表达情感。虚拟人的情感模型是虚拟人情感计算和决策的关键,是虚拟人具有情感能力的基础。这里主要工作就是通过模拟人的情感计算过程和决策机制,来建立虚拟人的情感工作机制,从而控制虚拟人的情感计算过程,使虚拟人具有模拟人的情感表达的能力。第二,通过分析情感语音信号,来识别情感语音信号中的参数信息,并进一步识别出情感语音信号中的情感信息。语音信号中的参数有多种,本文在比较和总结的基础上,选定了三种参数来综合的识别语音信号中的情感信息。在情感语音语料库的基础上建立了情感特征参数数据库,这个数据库的主要是建立特征参数的参数模型,为情感识别建立识别基础。第三,利用隐马尔科夫模型算法在语音信号识别上的优点,来对情感语音信号进行情感信息的识别。情感信息与语言信息有共同的声学特征,只是二者反映的信息不同。通过情感语音信号的特征分析和理论验证,隐马尔科夫模型是一个理想的选择。实验证明,隐马尔科夫模型在情感信息的识别上,表现出很好的识别效果和较高的识别率,为隐马尔科夫模型的应用提供了事实支持。第四,建立人机交互系统原型,通过对整个系统进行测试和验证,来证明人机情感交互的可行性和科学性。验证主要通过情感识别和情感决策两方面进行,情感识别的主要是建立在情感语音识别的基础上,情感决策就是通过验证虚拟人情感表达的结果跟期望值的对比结果。

    标签: 情感虚拟人技术 人机交互

    上传时间: 2022-06-18

    上传用户:jiabin

  • XFS5152CE语音合成芯片用户开发指南

    XFS5152CE是一款高集成度的语音合成芯片,可实现中文、英文语音合成;并集成了语音编码、解码功能,可支持用户进行录音和播放:除此之外,还创新性地集成了轻量级的语音识别功能,支持30个命令词的识别,并且支持用户的命令词定制需求。支持任意中文文本、英文文本的合成,并且支持中英文混读芯片支持任意中文、英文文本的合成,可以采用GB2312、GBK、BIG5和UNICODE四种编码方式。每次合成的文本量最多可达4K字节。芯片对文本进行分析,对常见的数字、号码、时间、日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理;对一般多音字也可以依据其语境正确判断读法;另外针对同时有中文和英文的文本,可实现中英文混读。支持语音编解码功能,用户可以使用芯片直接进行录音和播放芯片内部集成了语音编码单元和解码单元,可以进行语音的编码和解码,实现录音和播放功能。芯片的语音编解码具备高压缩率、低失真率、低延时的特点,并且可以支持多种语音编码解码速率。这些特性使它非常适合于数字语音通信、语音存储以及其它需要对语音进行数字处理的场合。如:车载微信、指挥中心等。支持语音识别功能可支持30个命令词的识别。芯片出默认设置的是30个车载、预警等行业常用识别命令词。客户如需要更改成其他的识别命令词,可进行命令词定制。

    标签: xfs5152ce 语音合成

    上传时间: 2022-06-22

    上传用户:

  • 微信智能机器人硬件功能模块介绍

    该项目是基于嵌入式开发平台的机器人,这个机器人主要使用树莓派和arduino作为核心控制,在互联网这个大的平台上进行机器人的工作和维护、主要使用环境是在室内。机器人系统运行的环境是Linux系统、主要是C、Python、PHP等语言、系统需要局域网或者公网的网络环境。计划实现环境监控及报警、安全防护、文体办公,家庭娱乐、媒体影音、出行天气等功能,机器人作为家庭里的小管家,当室内没人的时候,机器人在室内自主巡航进行环境检测、安全报警等并随时向用户提供家里情况,比如室内温度、煤气检测并实时上传到互联网。使用云服务器,大数据等。用户可以通过网页,或者微信对机器人进行一个部署。并且会报警处理一些事情,例如降温功能,人脸检测报警等。当用户在家时,机器人可以为用户播放音乐、电影、语音识别聊天等,而且还会抓取网络新闻、发送微博、邮件、生成扫描二维码、文字提取等功能都已经可以实现。另外该机器人已经实现了自主无线充电。

    标签: 智能机器人 硬件

    上传时间: 2022-07-23

    上传用户:

  • 智能机器人硬件模块详解

    智能机器人硬件功能模块介绍1.核心控制板:raspberry b+(树莓派B+):一种卡片式电脑。树莓派是只有信用卡大小的卡片式电脑,其系统基于Linux。截止至2012年6月1日,树莓派只有A和B两个型号,主要区别:A型:1个USB、无有线网络接口、功率2.5W,500mA、256MB RAM;B型:2个USB、支持有线网络、功率3.5W,700mA、512MB RAM。2.底层电路驱动芯片:Arduino 。Mega2560的处理器核心是ATmega2560,同时具有54路数字输入/输出口(其中16路可作为PWM输出),16路模拟输入,4路UART接口,一个16MHz晶体振荡器,一个USB口,一个电源插座,一个ICSP header和一个复位按钮。Arduino Mega2560也能兼容为Arduino UNO设计的扩展板。3.底层硬件:驱动电路、控制电路 包括(ln298、hc-06蓝牙模块、舵机、摄像头、麦克风、无线网卡、电机、地盘、传感器若干、材料等) 4.工作原理:树莓派用来处理上层指令、运用大型代码、和代码整合等,例如:人脸识别、语音识别、邮件发送、环境数据上传到互联网、获取网络指令等。通过串口通讯和底层驱动芯片arduino进行交互,和数据传输。arduino则负责底层电路的驱动、环境检测、快速机动、预报处理等工作1.该项目中我们自主研发了一套无线充电设备,最大的转换效率可以达到40%,安装在机器人的底端,可以实现机器人长时间的工作而不需要人为去充电,解决了用户不在家机器人也能正常工作的问题。该项目已经获得了专利。

    标签: 智能机器人 硬件 模块

    上传时间: 2022-07-25

    上传用户:zhaiyawei

  • 基于互联网 的智能机器人管家资料

    该项目是基于嵌入式开发平台的机器人,这个机器人主要使用树莓派和arduino作为核心控制,在互联网这个大的平台上进行机器人的工作和维护、主要使用环境是在室内。机器人系统运行的环境是Linux系统、主要是C、Python、PHP等语言、系统需要局域网或者公网的网络环境。计划实现环境监控及报警、安全防护、文体办公,家庭娱乐、媒体影音、出行天气等功能,机器人作为家庭里的小管家,当室内没人的时候,机器人在室内自主巡航进行环境检测、安全报警等并随时向用户提供家里情况,比如室内温度、煤气检测并实时上传到互联网。使用云服务器,大数据等。用户可以通过网页,或者微信对机器人进行一个部署。并且会报警处理一些事情,例如降温功能,人脸检测报警等。当用户在家时,机器人可以为用户播放音乐、电影、语音识别聊天等,而且还会抓取网络新闻、发送微博、邮件、生成扫描二维码、文字提取等功能都已经可以实现。另外该机器人已经实现了自主无线充电。

    标签: 智能机器人

    上传时间: 2022-07-25

    上传用户: