视频识别算法

基于DSP的人脸检测和定位算法研究.rar

人脸检测和定位是在图像中进行人脸检测,以及确定图像中人脸的位置、大小、个数等信息,最初作为自动人脸识别系统的定位环节被提出,近年来由于其在安全访问、智能监测、虚拟现实、基于内容的检索和新一代人机界面等领域的应用需求,作为一个独立的课题也备受研究者的重视。论文针对人脸检测定位和识别技术在智能视频监控系统的特殊应用,进行人脸检测和定位算法研究,并将这些算法通过DSP进行实现。论文工作如下： 1.本文针对人脸检测和定位问题,提出了基于YUV色彩空间的肤色检测的改进算法,通过在YUV空间对人脸肤色的聚类分析,建立了YUV肤色模型。仿真结果表明,该模型可以有效地检测到图像中的肤色区域,为人脸的粗定位奠定了基础。 2.针对图像中肤色不一定是人脸的问题,在人脸检测时,利用肤色确定候选区域,再利用一些规则对人脸候选区域进行判别或合并。针对图像只中存在一个人脸的情况,采用改进的坐标轴投影方法进行单个人脸的检测定位；针对图像中存在多个人脸的情况,利用改进的区域标定算法进行多个人脸的检测定位,使得算法能够完成单人脸检测和多人脸的检测定位,仿真结果表明了算法的有效性。 3.论文提出了通过DSP图像处理系统实现以上算法的过程,首先在MATLAB环境研究算法,然后进行算法的DSP移植,采用了有利于DSP处理的图像存储格式和算法结构,改善了算法的实时性。实际测试结果表明了算法在DSP上实现的正确性和可行性。基于DSP的人脸检测和定位算法的实现,对监控系统的智能化发展具有重要的实际意义。

标签： DSP 人脸检测定位

上传时间： 2013-05-22

上传用户：sunzhp
实时视频缩放算法研究及FPGA实现.rar

调整视频图像的分辨率需要视频缩放技术。如果图像缩放技术的处理速度达到实时性要求就可以应用于视频缩放。传统图像缩放技术利用插值核函数对已有像素点进行插值重建还原图像。本文介绍了图像插值的理论基础一采样定理，并对理想重建函数Sinc函数进行了讨论。本文介绍了常用的线性图像插值技术及像素填充、自适应插值和小波域图像缩放等技术。然后，本文讨论了分级线性插值算法的思想，设计并实现了FPGA上的分级双三次算法。最后本文对各种算法的缩放效果进行了分析和讨论。本文在分析现有视频缩放算法基础之上，提出了分级线性插值算法，并应用在简化线性插值算法中。分级线性插值算法以牺牲一定的计算精度为代价，用查找表代替乘法计算，降低了算法复杂度。本文设计并实现了分级双三次插值算法，详细说明了板上系统的模块结构。最后本文将分级线性插值算法与原线性插值算法效果图进行比较，比较结果显示分级插值算法与原算法误差较小，在放大比例较小时可以取代原算法。结果证明分级双三次线性插值算法的FPGA实现能够满足额定帧频，可以进行实时视频缩放。

标签： FPGA 实时视频算法研究

上传时间： 2013-04-24

上传用户：亚亚娟娟123
Adaboost算法的VLSI设计研究和FPGA实现.rar

随着计算机科学在人机交互领域的极大发展，作为人脸信息处理中的一项关键技术，人脸检测现在已经成为模式识别，计算机视觉和人机交互领域不可缺少的一部分。但是，人脸检测算法存在计算量大、速度慢等缺点。软件实现方式无法达到实时处理要求，而现有的硬件实现需要占用大量硬件资源。本文针对现有人脸检测硬件实现的缺点，通过对Adaboost算法和现有硬件结构的分析，提出了双流水线硬件检测架构：扫描窗口流水线、特征向量流水线。并在Vertex-II Pro FPGA平台验证成功，达到实时检测的标准。具体工作和创新点包括如下几点：介绍了人脸检测的原理以及人脸检测经典算法。其中，详细介绍了Adaboost算法。对现有的结构进行详细分析。指出现有各架构的缺点，即资源占用多，检测速度慢。针对这两个问题，本文提出了一个适合嵌入式应用的扫描窗口、特征向量双流水线检测硬件架构，详细说明了该架构的工作原理，并在该架构基础上，通过加入预测加载技术，进一步提高检测速度。随后，采用存储器访问效率，架构内部存储单元大小，检测时间长短，运算单元数量四个标准，详细比较了新架构和现有架构的差别，显示出新架构的优势。基于提出的架构，给出了Adaboost人脸检测系统的VLSI实现方案。本文中，采用自顶向下的设计方法将人脸检测系统分成若干个子模块，然后对每个子模块进行详细的设计和说明，给出了每个子模块的硬件架构、状态转换以及verilog实现后的仿真波形。采用Xilinx公司的VII Pro FPGA开发板完成人脸检测系统的硬件验证。FPGA验证结果表明对于QCIF分辨率的视频图像，人脸检测系统能够达到50fps的检测速度，满足实时检测的要求。

标签： Adaboost VLSI FPGA

上传时间： 2013-06-15

上传用户：1193169035
视频格式转换算法研究及FPGA实现——去隔行、帧频转换、分辨率变换.rar

在当今的广播系统中，绝大部分的视频信号是隔行采样的。采用这种扫描格式，能够大幅度地减少视频的带宽，但也会引起彩色爬行、画面闪烁、边缘模糊及锯齿等现象。这种缺陷经人尺寸屏幕放大后就更加明显。为改善画面的视觉效果，去隔行技术应运而生。同时，视频信号本身的低帧频也会导致行抖动、线爬行以及大面积闪烁等视觉效果上的缺陷。增加扫描频率会把这些视觉缺陷搬移到人眼不敏感的高频区域上去从而产生较好的主观图象质量。而为了适应不同显示终端以及对图像大小变化的要求就必须对原始信号分辨率即每帧行数和每行像素数进行变换。因此去隔行、帧频转换、分辨率变换成为视频格式转换的基本内容。 FPGA 的出现是VLSI技术和EDA技术发展的结果。FPGA器件集成度高、体积小，具有通过用户编程实现专门应用的功能。它允许电路设计者利用基于计算机的开发平台，经过设计输入、仿真、测试和校验，直到达到预期的结果。使用FPGA器件可以大大缩短系统的研制周期，减少资金投入。另外采用FPGA器件可以将原来的电路板级产品集成芯片级产品，从而降低了功耗，提高了可靠性，同时还可以很方便的对设计进行在线修改。该文在介绍了视频格式转换中的主要算法后，重点对去隔行、帧频转换、分辨率变换的FPGA综合实现方案进行了由简单到复杂的深入研究，分别给出了最简解决方案、基于非线性算法的解决方案和基于运动补偿的解决方案。最简解决方案利用线性算法将去隔行，帧频转换，分辨率变换三项处理同时实现，达到FPGA内部资源和外部RAM耗用量都为最小的要求，是后续复杂方案的基础。其中去隔行采用场合并方式，帧频转换采用帧重复方式，分辨率变换采用均匀插值方式。基于非线性算法的解决方案中加入了对静止区域的判断，静止区域的输出像素值直接选用相应位置的已存输入数据，非静止区域的输出像素值通过对已存输入数据进行非线性运算得出。基于运动补偿的解决方案在对静止区域进行判断和处理的基础上，对欲生成的变频后的场间插值帧进行运动估计，根据运动矢量得出非静止区域的输出像素值。其中为求得输入场间相应时间位置上的插值帧输出数据，该方案采用了自定义的前后向块匹配运动估计方式，通过对三步搜索算法的高效实现，将SAD 值进行比较得出运动矢量。

标签： FPGA 视频格式转换算法研究

上传时间： 2013-07-19

上传用户：米卡
基于ARMDSP嵌入式视频监控系统的设计与研究

随着网络、通信和微电子技术的快速发展和人民物质生活水平的提高，视频监控系统以其直观、方便和信息内容丰富的特点而被广泛的应用。本文利用ARM+DSP的双核结构，对基于ARM+DSP嵌入式的视频监控系统进行了设计和研究。本系统大致分成两部分-DSP图像采集处理部分和ARM实时控制应用部分两部分。子系统分别选用TMS320DM642和AT91RM9200作为两部分的主控芯片，利用它们各自的优势在系统中发挥不同的功能。 DSP的图像采集处理部分通过CCD摄像头对特定的区域采集视频图像，并由视频解码芯片进行视频解码处理。处理后的数字视频信号放入DSP内通过视频运动检测算法进行图像处理，以掌握是否有异常的情况发生。如果有异常情况发生，则立刻由DSP向ARM实时控制应用部分施加中断信号，并将识别处理后的结果全部发送过去。 ARM的实时控制应用部分实现对DSP图像采集处理部分的实时控制，实现支持Linux平台的硬件架构，实现网口、串口和USB等接口用于数据传输，实现图像的显示和友好的人机界而等等。ARM实时控制应用部分本身不参与图像识别和处理相关的算法实现，而只是配合DSP将图像处理的结果显示出来，并在恰当的时机触发外部控制器实现一定的对外控制功能。基于ARM+DSP架构的视频监控系统的设计思想与实现原理，本系统分为控制模块和视频处理模块，二者独立开发和调试，通过HPI并行方式连接，提高了软硬件任务的模块化程度，增加了系统的稳定性、可靠性和灵活性，符合嵌入式视频监控的功能要求，可以面对日益复杂的视频应用。本文还介绍了基于AT91RM9200处理器子系统开发板的底层BootLoader程序的开发和对Linux操作系统移植的过程。最后论文在设计并实现的基础上对系统的改进提出了一些新的方法和建议。

标签： ARMDSP 嵌入式视频监控系统

上传时间： 2013-06-19

上传用户：金宜
期刊论文：基于DTW算法的语音识别系统实现

·期刊论文：基于DTW算法的语音识别系统实现

标签： DTW 论文算法语音识别系统

上传时间： 2013-05-16

上传用户：qiuqing
一个用VB编写的双音多频识别程式(运用傅里叶变换算法)

·一个用VB编写的双音多频识别程式(运用傅里叶变换算法)文件列表: AudioFFT.bas back.bmp DTMF.exe DTMF.frm DTMF.frx DTMF.vbp frmAbout.frm frmAbout.frx

标签： 编写双音多频傅里叶变换程式

上传时间： 2013-05-18

上传用户：ABCD_ABCD
高精度C语音识别(使用双精度变音算法)

·详细说明：高精度C语音识别。使用双精度变音算法。系统环境：Access2002+文件列表: Metaphone.NET .............\AssemblyInfo.cs .............\bin .............\...\Debug .............\...\Release

标签： 高精度语音识别精度变音

上传时间： 2013-04-24

上传用户：蒋清华嗯
基于PCA和BP神经网络算法的车牌字符识别

·基于PCA和BP神经网络算法的车牌字符识别

标签： PCA BP神经网络算法车牌字符

上传时间： 2013-04-24

上传用户：maizezhen
语音识别：语音矢量化及算法及与原文件的矢量对比功能源代码

·详细说明：语音识别:语音矢量化及算法及与原文件的矢量对比功能源代码文件列表: BShvoice ........\Debug ........\dllSudx.h ........\dllSudx.lib ........\SHvoice.cpp ........\SHvoice.dsp ......

标签： 语音识别语音矢量化矢量

上传时间： 2013-07-10

上传用户：博雅abcd