浮点算法

Adaboost算法的VLSI设计研究和FPGA实现.rar

随着计算机科学在人机交互领域的极大发展，作为人脸信息处理中的一项关键技术，人脸检测现在已经成为模式识别，计算机视觉和人机交互领域不可缺少的一部分。但是，人脸检测算法存在计算量大、速度慢等缺点。软件实现方式无法达到实时处理要求，而现有的硬件实现需要占用大量硬件资源。本文针对现有人脸检测硬件实现的缺点，通过对Adaboost算法和现有硬件结构的分析，提出了双流水线硬件检测架构：扫描窗口流水线、特征向量流水线。并在Vertex-II Pro FPGA平台验证成功，达到实时检测的标准。具体工作和创新点包括如下几点：介绍了人脸检测的原理以及人脸检测经典算法。其中，详细介绍了Adaboost算法。对现有的结构进行详细分析。指出现有各架构的缺点，即资源占用多，检测速度慢。针对这两个问题，本文提出了一个适合嵌入式应用的扫描窗口、特征向量双流水线检测硬件架构，详细说明了该架构的工作原理，并在该架构基础上，通过加入预测加载技术，进一步提高检测速度。随后，采用存储器访问效率，架构内部存储单元大小，检测时间长短，运算单元数量四个标准，详细比较了新架构和现有架构的差别，显示出新架构的优势。基于提出的架构，给出了Adaboost人脸检测系统的VLSI实现方案。本文中，采用自顶向下的设计方法将人脸检测系统分成若干个子模块，然后对每个子模块进行详细的设计和说明，给出了每个子模块的硬件架构、状态转换以及verilog实现后的仿真波形。采用Xilinx公司的VII Pro FPGA开发板完成人脸检测系统的硬件验证。FPGA验证结果表明对于QCIF分辨率的视频图像，人脸检测系统能够达到50fps的检测速度，满足实时检测的要求。

标签： Adaboost VLSI FPGA

上传时间： 2013-06-15

上传用户：1193169035
基于H.264编解码的算法优化研究及FPGA的硬件实现.rar

H.264/AVC是由ITU和ISO两大组织联合组成的JVT共同制定的一项新的视频压缩技术标准，在较低带宽上提供高质量的图像传输是H.264/AVC的应用亮点。在同样的视觉质量前提下，H.264/AVC比H.263和MPEG-4节约了50％的码率。但H.264获得优越性能的代价是计算复杂度的增加，据估计其编码的计算复杂度大约为H.263的3倍，因此很难应用于实时视频处理领域。针对这一现状，业内做了大量的研究工作，力图降低其计算复杂度和提高运行效率。比如在运动估计方面，国内外在这方面的研究已经很成熟。而针对帧内/帧间预测编码的研究却较少。因此研究预测模式的快速算法具有理论意义和应用价值。本文在详细研究H.264标准视频压缩编码特点基础上，分析了H.264帧内编码, 帧间编码及变换，量化技术的原理及特点，提出了一种基于局部边缘方向信息的快速帧内模式判决算法，通过结合SAD的模式选择方法来减少模式选择数目。它采用了Sobel梯度算子计算当前块的边缘信息，累加当前块中属于同一方向像素点的边缘矢量构造不同模式下的边缘方向直方图，以便确定最可能的预测模式。该算法有效降低了编码器的运算复杂度，在并未显著降低编码性能的情况下提升了编码器效率。仿真表明：Foreman 图像序列编码性能有了提高，其中PSNR平均降低了0.06dB，Bitrate平均降低了19.4％，这大大提高了视频传输的质量。另外在帧间预测模式选择算法方面进行了改进研究：按顺序对不同类型进行判决，有选择地去比较可能模式，使得在有效减少需判决的模式数量的同时，结合小块模式搜索中途停止准则来确定最优模式。仿真表明：改进算法相对与原来算法能够节省很多的编码时间（平均下降了49.3％），但带来的图像质星的下降（平均下降0.08dB,可以忽略）和码率较少的增加。同时在整数DCT变换模块中，提出了一种快速蝶形算法，使得对4×4点数据做一次变换，只需通过8×8次加法和2×8次移位运算便可完成，与原来12×8次加法和4×8次移位相比，新算法大大降低了运算复杂度。最后介绍FPGA的特点及设计流程，并实现了H.264编解码器中变换编码及量化和熵解码模块的硬件。这种基于FPGA所实现的H.264编码视频处理模块设计具备了成本低，周期短，设计方法灵活等优点，具有广阔的市场应用前景。仿真表明，通过使用本文提出的帧内/帧间速算法方法可使得H.264编码速度获得显著的提高，使H.264 Baseline编码器能在PC平台上实现实时编码。

标签： FPGA 264 编解码

上传时间： 2013-07-18

上传用户：zukfu
图像缩放算法研究及其FPGA实现.rar

图像缩放在图像处理领域中，发挥着重要作用。图像的分辨率调整和格式变换，都需要用到图像缩放技术。随着多媒体技术和大规模集成电路的发展，利用硬件实现视频图像无级缩放已成为图像处理研究的一个重要课题。图像缩放通常由插值算法实现。传统的插值算法由于实现原理的局限性，在缩放时容易引起边缘锯齿或细节模糊现象。针对传统插值算法的这个不足，出现了许多基于边缘改进的算法。但这些算法一般只能完成2k倍数插值，无法真正做到基于边缘的无级缩放。为了实现基于边缘改进的无级缩放，本文做了如下五个方面的研究工作： 1.系统回顾了图像缩放技术，包括传统图像缩放技术和多边缘检测插值，分析了这些图像缩放技术的优缺点。 2.重点研究了新兴的方向多项式插值算法，该算法能够真正完成基于边缘改进的无级缩放。 3.提出改进的方向多项式插值算法(IOPI算法)，该算法针对硬件实现，做了两个方面改进：提出EDV算法，简化边缘方向的确定；提出Cubic6逼近插值算法(A-Cubic6算法)，改善平坦区域缩放效果。其中的EDV算法通过加减、比较模块，完成边缘方向的确定。相比原算法中的乘除法、直方图计算，大大简化了硬件实现，降低了硬件实现成本。A-Cubic6算法利用查找表简化了Cubic6点插值算法的实现，而且明显改善了非边缘区域的缩放效果。 4.研究缩放算法与图像质量的评价方法。比较、分析各算法的软件仿真结果，得出结论：本文提出的IOPI算法在平坦区域和边缘区域都具有比其它算法更突出的效果。 5.结合实时视频处理要求，研究了IOPI算法的FPGA实现。已完成最近邻域插值和A-Cubic6算法的FPGA实现，可以在硬件平台上稳定工作。

标签： FPGA 图像算法研究

上传时间： 2013-06-05

上传用户：2728460838
高噪声率下极值型中值滤波算法的改进

极值型中值滤波算法在高噪声率下的滤波效果不是很好，主要原因有以下两个：首先，滤波窗口中过多的噪声点会使窗口中的点在排序时产生中值偏移；其次是高噪声率环境下，可能序列中值本身就是是噪声点。对此，本文提出

标签： 高噪声率中值滤波法的改进

上传时间： 2013-06-26

上传用户：小小小熊
基于FPGA/CPLD实现的FFT算法与仿真分析

可编程逻辑器件FPGA(现场可编程门阵列)和CPLD(复杂可编程逻辑器件)越来越多的应用于数字信号处理领域，与传统的ASIC(专用集成电路)和DSP(数字信号处理器)相比，基于FPGA和CPLD实现的数字信号处理系统具有更高的实时性和可嵌入性，能够方便地实现系统的集成与功能扩展。 FFT的硬件结构主要包括蝶形处理器、存储单元、地址生成单元与控制单元。本文提出的算法在蝶形处理器内引入流水线结构，提高了FFT的运算速度。同时，流水线寄存器能够寄存蝶形运算中的公共项，这样在设计蝶形处理器时只用到了一个乘法器和两个加法器，降低了硬件电路的复杂度。为了进一步提高FFT的运算速度，本文在深入研究各种乘法器算法的基础上，为蝶形处理器设计了一个并行乘法器。在实现该乘法器时，本文采用改进的布斯算法，用以减少部分积的个数。同时，使用华莱士树结构和4-2压缩器对部分积并行相加。本文以32点复数FFT为例进行设计与逻辑综合。通过设计相应的存储单元，地址生成单元和控制单元完成FFT电路。电路的仿真结果与软件计算结果相符，证明了本文所提出的算法的正确性。另外，本文还对设计结果提出了进一步的改进方案，在乘法器内加入一级流水线寄存器，使FFT的速度能够提高到当前速度的两倍，这在实时性要求较高的场合具有极高的实用价值。

标签： FPGA CPLD FFT 算法

上传时间： 2013-07-18

上传用户：wpt
ECC密码算法的FPGA实现及优化设计

　　本文主要对基于FPGA芯片的椭圆曲线密码算法的实现及优化设计进行了研究。由于点乘运算极大影响了椭圆曲线密码系统的加/解密速度，本文对点乘运算的FPGA设计进行了重点优化。首先比较分析了三种点乘算法，从运算复杂度的角度确定了蒙哥马里算法是最利于FPGA芯片实现的。然后根据蒙哥马里算法，用VerilogHDL语言实现了基于FPGA芯片的椭圆域中的基本运算(模加、模乘、模平方和模逆)。通过三种模乘算法在FPGA上的实现，设计出一种串并混合的乘法器，达到了面积与速度的最佳匹配。本文利用Modelsim对本课题设计的硬件系统进行了仿真实验，验证了所设计的硬件系统完成了椭圆曲线密码算法在FPGA上的实现。最后使用SynplifyPro进行综合及布局布线，综合报告文件证明了本课题所设计的ECC加密系统达到了优化芯片速度和面积的目的。

标签： FPGA ECC 密码算法优化设计

上传时间： 2013-04-24

上传用户：thuyenvinh
红外焦平面阵列非均匀校正算法研究及其FPGA硬件实现

　本文结合中国科技大学大规模集成电路实验室和中国科学院上海技术物理研究所合作的星载红外相机项目，为了解决红外相机上的不同波段的红外探测元阵列存在的非均匀性问题，对红外焦平面探测元阵列存在的非均匀性问题展开了深入的分析和研究。主要研究和分析了两类算法的基本原理，重点研究和实现了定标校正算法，通过对积分球定标数据进行深入的分析，将探测元分成线性探测元和非线性探测元，对线性探测元采用两点校正法，对非线性探测元采用多点分段校正算法，在利用FPGA硬件实现非均匀校正时，分析设计了基于乘法运算和加法运算的FPGA实现，在基于乘加器运算的FPGA实现中。设计出了乘法和加法整体运算的乘加器，内部采用流水线wallace树压缩结构，大大加快乘法和加法的速度。

标签： FPGA 红外焦平面校正算法研究

上传时间： 2013-04-24

上传用户：weddps
指纹识别算法的研究及基于FPGA的硬件实现

随着图像处理和模式识别技术的进步，基于生物特征的识别技术成为蓬勃发展的高技术之一，根据IBG(InternationalBiometricGroup)组织对生物特征市场的统计和预测，该领域的收入的年增长率30-50％，到2008年，全球总收入将达到46.39亿美元。而基于指纹特征的识别技术由于其独特的可靠性，稳定性，方便快捷的特点，恰好符合了市场的需求。目前指纹识别技术是生物识别领域中应用最广泛的识别技术，也是研究与应用的一个热点。 SOPC片上可编程系统和嵌入式系统是当前电子设计领域中最热门的概念。NiosⅡ是Altera公司开发的一种采用流水线技术、单指令流的RISC嵌入式处理器软核，可以将它嵌入FPGA内部，与用户自定义逻辑结合构成一个基于FPGA的片上系统。与嵌入式硬核相比较，嵌入式软核具有更大的灵活性。而FPGA的高速性、恰恰满足了指纹识别系统对速度的要求。本文对指纹识别技术中各个环节的算法进行了较为深入的研究，结合NiosⅡ嵌入式处理器的特点，对算法进行了合理的选择与优化，形成了一套完整的指纹识别算法，并提出了一种基于FPGA的指纹识别系统硬件设计方案。论文的内容主要包括以下几个方面： 1、对指纹图像预处理、后处理和匹配算法进行了改进，提高了算法的性能；设计了一种适用于快速匹配的指纹特征数据结构；提出了一套基于特征点匹配的指纹识别算法。实验结果表明该算法速度快、误识率较低、可靠性较高，可以满足实用的要求。 2、本着增加系统集成度、减小系统体积、提高便携性、降低功耗和成本，同时提升系统的性能的原则，使用Altera公司提供的外围设备IP核配合NiosⅡ处理器软核搭建了一个单片嵌入式系统，然后以内嵌NiosⅡ软核的FPGA和FPS200指纹采集器为核心芯片，外配片外RAM和Flash存储器以及小键盘和LCD显示屏等器件，设计了一个便携式指纹识别系统，提出了一套基于FPGA的硬件设计方案。 3、利用NiosⅡ开发板对硬件设计方案进行了初步的验证，实现了指纹采集芯片FPS200与FPGA的接口，并进行了算法的移植。实验结果表明本文所提出的系统设计方案是可行的。基于FPGA的自动指纹识别系统在速度、功耗、体积、扩展性方面有着独特的优势，具有广阔的发展空间。最后提出了对这一设计继续改进的思路和下一步研究的内容。

标签： FPGA 指纹识别法的研究硬件实现

上传时间： 2013-06-07

上传用户：kikye
基于小波分解和模糊聚类的MRI图像去噪以及分割算法研究

磁共振成像（MRI）由于自身独特的成像特点，使得其处理方法不同于一般图像.根据不同的应用目的，该文分别提出了MRI图像去噪和分割两个算法.首先，该文针对MRI重建后图像噪声分布的实际特点，提出了基于小波变换的MRI图像去噪算法.该算法详细阐明了MRI图像Rician噪声的特点，首先对与噪声和边缘相关的小波系数进行建模，然后利用最大似然估计来进行参数估计，同时利用连续尺度间的尺度相关性特点来进行函数升级，以便获得最佳萎缩函数，进一步提高图像的质量，最终取得了一定的效果.与此同时，该文对MRI图像的进一步的分析与应用展开了一定研究，提出了一种改进的快速模糊C均值聚类鲁棒分割算法.该算法先用K均值聚类方法得到初始聚类中心点，同时考虑邻域对分割结果的影响，对目标函数加以改进，用来克服噪声和非均匀场对MRI图像分割的影响，达到鲁棒分割的目的，为进一步图像处理和分析打下基础.通过实验，我们发现，无论是针对模拟图像还是实际图像，该文所提出的两个算法都取得了较好的效果，达到了预期的目的.

标签： MRI 小波分解图像去噪分割

上传时间： 2013-04-24

上传用户：zhichenglu
自定制Nios处理器的FFT算法指令

本文深入研究了Nios 自定制指令的软硬件接口，基于Altera 的IP 核FFT V2.2.0实现了变换长度为1024 点的高速复数FFT 算法，提出了一种在Nios 嵌入式系统中定制用户FFT 算

标签： Nios FFT 定制处理器

上传时间： 2013-04-24

上传用户：hfmm633