📄 ml.htm
字号:
<!ArtChnTitle>
<!ArtChnAuthor>
<!ArtAuthorAddress>
<!ArtChnAbstract>
<!ArtChnKeyword>
<!ArtEngTitle>
<!ArtEngAuthor>
<!ArtEngAbstract>
<!ArtEngKeyword>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<title>学位论文-小型语音识别系统的研究和开发</title>
<style>A:link {COLOR: #000000; FONT-FAMILY: 宋体; TEXT-DECORATION: none}
A:visited {COLOR: #000000; FONT-FAMILY: 宋体; TEXT-DECORATION: none}
A:active {FONT-FAMILY:宋体; TEXT-DECORATION: none}
A:hover {COLOR: #000000;TEXT-DECORATION:none}
BODY {FONT-FAMILY:宋体; FONT-SIZE: 9pt;TEXT-DECORATION:none}
TABLE {FONT-FAMILY: 宋体; FONT-SIZE: 9pt}
.H1 {FONT-SIZE: 9pt; COLOR: #0000cc}
.ourfont {FONT-SIZE: 9pt; LINE-HEIGHT: 14pt}
select {font-size:12px;}
.wx {BACKGROUND: #001863; BORDER-BOTTOM: white 1px solid; BORDER-LEFT: white 1px solid; BORDER-RIGHT: white 1px solid; BORDER-TOP: white 1px solid; COLOR: #ffffff; FONT-SIZE: 9pt; FONT-STYLE: normal; FONT-VARIANT: normal; FONT-WEIGHT: normal; HEIGHT: 18px; LINE-HEIGHT: normal}
.wx1 {border-top: #c0c0c0 1px;border-left: #c0c0c0 1px;border-right:#c0c0c0 1px;border-bottom:#c0c0c0 1px;border-style:inset;background-color:#ffffff;vertical-align:text-bottom}
</style>
</head>
<body bgcolor="#FFFFFF" link="#000000" background="../image/bg.gif.htm" tppabs="http://wanfang.lib.sjtu.edu.cn/%7eCDDBN/Y592432/image/bg.gif">
<img src="../../images/xwlwk.jpg.htm" tppabs="http://wanfang.lib.sjtu.edu.cn/%7eCDDBN/images/xwlwk.jpg" width="750" height="94">
<table width="83%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="19%"><p> </p>
<p></p></td>
<td width="81%"><p>馆藏号:Y592432<br>
<br>
论 文 题 目:<strong style="font-weight: 400">小型语音识别系统的研究和开发</strong><br>
学位授予单位:天津大学<br>
作 者:张众<br>
申请学位级别:硕士<br>
学 科 名 称:生物医学工程<br>
指 导 教 师:虞启琏<br>
出 版 时 间:20040101<br>
摘 要:<br>
语音是人与机器之间进行交流的重要工具.语音识别就是让机器听懂人的话,语音识别技术在实际中得到广泛应用.该文小型语音识别系统是针对小词汇量的孤立词语音识别,该论文从两个方面进行论述.一方面从模式识别的角度研究,讨论了语音识别的原理和模型,建立了小型词库的语音识别模型.论文首先介绍了语音识别的基本原理,包括语音信号的数字模型和语音信号的数字处理,重点论述了语音的分帧和端点检测.语音信号特征的提取是语音识别的重要环节,该文介绍了两种语音特征参数:线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),我们选取MFCC参数作为语音识别的特征参数.该文论述了动态时间规整算法(DTW)和隐马尔可夫模型(HMM)的原理,重点讲述了在语音识别系统的应用.基于DTW建立了针对特定人的小型语音识别模型,对"0~9"十个数字和23个中文词汇进行识别实验,取得了较好的识别效果;基于连续高斯分布的HMM建立了针对非特定人的小型语音识别模型,对十个数字进行了非特定人识别实验,取得了初步实验结果.另一个方面从指令系统的软件开发考虑,利用软件开发包Speech API建立一个嵌入内窥镜成像系统的语音指令识别系统.在指令识别系统上对23个中文词汇进行语音识别测试,取得较好的识别效果,解决了系统的语音拒识问题,提出了改进系统识别效果的方法.<br>
分 类 号:TN912.34<br>
关 键 词:语音识别;端点检测;线性预测编码;Mel频率倒谱系数;动态时间规整;隐马尔可夫模型;Speech API
<p align="center">
<table width="80" border="0" cellspacing="0" cellpadding="0">
<tr>
<td bgcolor="#cccccc">
<table width="100%" border="0" cellspacing="1" cellpadding="0">
<tr style="CURSOR: hand">
<td bgcolor="#CCCCCC" onMouseOver="this.bgColor='#999999';" onMouseOut="this.bgColor='#cccccc';" valign="bottom" height="18" NAME="NAME_BALL" STYLE="cursor:hand" child="FALL"><div align="center"><strong><font size="4"><a href="index.htm" tppabs="http://wanfang.lib.sjtu.edu.cn/%7eCDDBN/Y592432/PDF/index.htm">PDF正文</a></font></strong></div></td>
</tr>
</table></td>
</tr>
</table>
</td>
</tr>
</table>
<div align="center"></div>
</body>
</html>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -