📄 说明.txt

📁 能够简单识别0~9十个数字的matlab程序

💻 TXT

字号:

用matlab仿真0到9十个数字的语音识别
1、对语音的WAV文件和LAB文件进行处理，产生十个文件，每个文件对应于一个数字，存贮着该数字的波形文件。（shujuzhengli.m）
2、分别利用上面十个文件训练出十个HMM模板，具体方法是：首先将语音的波形文件分帧，以128个点为一帧，帧移为64，每一帧通过mfcc.m计算出13个系数，随着波形的长度不同，一个语音文件可以计算得到13*N个系数，截取13*15的矩阵（mfcc系数）用作训练数据。一般一个HMM模板用20组mfcc系数训练，得到初始状态分布、状态转移矩阵、高斯正态分布的均值和方差以及混合矩阵，这就是该语音的特征，存贮下来，识别的时候使用。（trainmfcc.m）
3、识别过程：识别的前面部分与训练相似，都是要计算得到mfcc系数，不同在于，识别时，将计算得到的mfcc 参数分别代入训练得到的HMM模板求出概率，比较出最大概率者，则该模板对应的数字就是识别的数字。(shibiesb.m)
4、用大量语音文件做测试，结果正确率为90%以上。（tongjijieguo.m）

⌨️ 快捷键说明

复制代码 Ctrl + C

搜索代码 Ctrl + F

全屏模式 F11

切换主题 Ctrl + Shift + D

显示快捷键 ?

增大字号 Ctrl + =

减小字号 Ctrl + -