说话人识别是语音识别的一种特殊方式
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种...
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种...
语音识别中的模型和算法:动态时间归正技术(DTW),隐马尔可夫模型(HMM),高斯混合模型(GMM),高斯混合模型(GMM)...
本文完成了对唇动身份识别技术几个基本问题的理论研究,并对整个系统加以实现.作为本文研究的实验基础,我们建立了唇动方式身份识别数据库(HITLUDB), 该库目前包含30个说话人每人20个汉语词的音视频语料.数据库的扩充与完善工作仍在不断的进行之中.在嘴唇检测方面, 我们对自适应色度过滤模型进行改...
基于隐马尔科夫的原来,写了相关关于HMM模型的代码。...
Hidden_Markov_model_for_automatic_speech_recognition This code implements in C++ a basic left-right hidden Markov model and corresponding Baum-Welch...