本文完成了对唇动身份识别技术几个基本问题的理论研究,并对整个系统加以实现.作为本文研究的实验基础,我们建立了唇动方式身份识别数据库(HITLUDB),
该库目前包含30个说话人每人20个汉语词的音视频语料.数据库的扩充与完善工作仍在不断的进行之中.在嘴唇检测方面,
我们对自适应色度过滤模型进行改...
📅
👤 wsf950131
FFmpeg是用于录制、转换和流化音频和视频的完整解决方案, 包括 libavcodec ,一套领先的音/视频编解码类库。FFmpeg 在Linux上开发,当可以在大多数操作系统下编译,包括Windows。...
📅
👤 sardinescn
MediaPlayer程序可以播放声音、视频文件,还可以显示静态图象文件,如果有CMX DLLs的话,该程序也可以记录或回放高通公司的QCP格式音频文件。它最多可以保存32个多媒体文件。Mediaplayer有常用的功能,例如播放、快速播放、停止和暂停等,它支持许多多媒体格式,包括QCP,MPEG ...
📅
主要完成了视频PS流的分析过程,并对其中的音视频提取出来...
📅
👤 erkuizhang
MP5解码全SCH和PCB文件,播放RM、RMVB和常用的音视频格式。...
📅
👤 362279997