Rtl

智能人脸识别算法及其FPGA的实现.rar

人脸自动识别技术是模式识别、图像处理等学科的一个最热门研究课题之一。随着社会的发展,各方面对快速有效的自动身份验证的要求日益迫切，而人脸识别技术作为各种生物识别技术中最重要的方法之一，已经越来越多的受到重视。对于具有实时，快捷，低误识率的高性能算法以及对算法硬件加速的研究也逐渐展开。本文详细分析了智能人脸识别算法原理，发展概况和前景，包括人脸检测算法，人眼定位算法，预处理算法，PCA和ICA 算法，详细分析了项目情况，系统划分，软硬件平台的资源和使用。并在ISE软件平台上，用硬件描述语言(verilog HDL)对算法部分严格按照FPGA代码风格进行了Rtl 硬件建模，并对C++算法进行了优化处理，通过仿真与软件算法结果进行比对，评估误差，最后在VirtexII Pro FPGA 上进行了综合实现。主要研究内容如下：首先，对硬件平台xilinx的VirtexII Pro FPGA 上的系统资源进行了描述和研究，对存储器sdram,RS-232 串口，JTAG 进行了研究和调试，对Coreconnect的OPB总线仲裁机理进行了两种算法的比较，Rtl 设计，仿真和综合。利用ISE和VC++软件平台，对verilog和C++算法进行同步比较测试，使每步算法对应正确的结果。对软硬件平台的合理使用使得在项目中能尽可能多的充分利用硬件资源，制板时正确选型，以及加快设计和调试进度。其次，对人脸识别算法流程中的人脸检测，人眼定位，预处理，识别算法分别进行了比较研究，选取其中各自性能最好的一种算法对其原理进行了分析讨论。人脸检测采用adaboost 算法，因其速度和精度的综合性能表现优异。人眼定位采用小块合并算法，因为它具有快速，准确，弱时实的特点。预处理算法采用直方图均衡加平滑的算法，简单，高效。识别算法采用PCA 加ICA 算法，它能最大的弱化姿态和光照对人脸识别的影响。最后，使用Verilog HDL 硬件描述语言进行算法的Rtl 建模，在C++算法的基础上，保证原来效果的前提下，根据FPGA 硬件特点对算法进行了优化。视频输入输出是人脸识别的前提，它提供FPGA 上算法需要处理的数据，预处理算法在C++算法的基础上进行了优化，最大的减少了运算量，提高了运算速度，16 位计算器模块使得在算法实现时可以根据系统要求，在FPGA的ip 核和自己设计的模块之间选择性能更好的一个来调用，FIFO的设计提供同步和异步时钟域的数据缓存。设计在ISE和VC++软件平台同时进行，随时对verilog和C++数据进行监测和比对。全部设计模块通过仿真，达到预定的性能要求，并在FPGA 上综合实现。

标签： FPGA 人脸识别算法

上传时间： 2013-07-13

上传用户：李梦晗
图像缩放算法的研究与FPGA设计.rar

Scaler是平板显示器件(FPD，Flat Panel Display)中的重要组成部分，它将输入源图像信号转换成与显示屏固定分辨率一致的信号，并控制其显示在显示屏上。本文在研究图像缩放算法和scaler在FPD中工作过程的基础上，采用自上而下(Top-down)的设计方法，给出了scaler的设计及FPGA验证。该scaler支持不同分辨率图像的缩放，且缩放模式可调，也可以以IP core的形式应用于相关图像处理芯片中。图像缩放内核是scaler的核心部分，它是scaler中的主要运算单元，完成图像缩放的基本功能，它所采用的核心算法以及所使用的结构设计决定着缩放性能的优劣，也是控制芯片成本的关键。因此，本文从缩放内核的结构入手，对scaler的总体结构进行了设计；通过对图像缩放中常用算法的深入研究提出了一种新的优化算法——矩形窗缩放算法，并对其计算进行分析和简化，降低了计算的复杂度。FPGA设计中，采用列缩放与行缩放分开处理的结构，使用双口RAM作为两次缩放间的数据缓冲区。使用这种结构的优势在于：行列缩放可以同时进行，数据处理的可靠性高、速度快：内核结构简单明了,数据缓冲区大小合适，便于设计。此外，本文还介绍了其他辅助模块的设计，包括DVI接口信号处理模块、缩放参数计算与控制模块以及输出信号检测与时序滤波模块。本设计使用Verilog HDL对各模块进行了Rtl级描述，并使用Quartus II7.2进行了逻辑仿真，最后使用Altera公司的FPGA芯片来进行验证。通过逻辑验证和系统仿真，证明该scaler的设计达到了预期的目标。对于不同分辨率的图像，均可以在显示屏上得到稳定的显示。

标签： FPGA 图像法的研究

上传时间： 2013-05-30

上传用户：xiaowei314
基于FPGA的通用数字化音频处理平台的研究与实现.rar

目前对数字化音频处理的具体实现主要集中在以DSP或专用ASIC芯片为核心的处理平台的开发方面，存在着并行处理性能差，系统升级和在线配置不灵活等缺点。另一方面现有解决方案的设计主要集中于处理器芯片，而对于音频编解码芯片的关注度较低，而且没有提出过从芯片层到PCB板层的完整设计思路。本文针对上述问题对数字化音频处理平台进行了研究，主要内容包括： 1、提出了基于FPGA的通用音频处理平台，该方案有别于现有的基于MCU、DSP和其它专用ASIC芯片的方案，论证了基于FPGA的音频处理系统的结构及设计工作流程，并对嵌入式音频处理系统专门进行了研究。 2、提出了从芯片层到PCB板层的完整设计思路，并将设计思路得以实现。完成了FPGA的设计及实现过程，包括：系统整体分析，设计流程分析，配置模块和数据通信模块的Rtl实现等；解决了FPGA与音频编解码芯片TLV320AIC23B之间接口不匹配问题；给出配置和数据通信模块的功能方框图；从多个角度完善PCB板设计，给出了各个系统组成部分的详细设计方案和硬件电路原理图，并附有PCB图。 3、建立了实验和分析环境，完成了各项实验和分析工作，主要包括：PCB板信号完整性分析和优化，FPGA系统中各个功能模块的实验与分析等。实验和分析结果论证了系统设计的合理性和实用性。本文的研究与实现工作通过实验和分析得到了验证。结果表明，本文提出的由FPGA和音频编解码芯片TLV320AIC23B组成的数字化音频处理系统完全可以实现音频信号的数字化处理，从而可以将FPGA在数字信号处理领域的优点充分发挥于音频信号处理领域。

标签： FPGA 通用数字处理平台

上传时间： 2013-04-24

上传用户：lanwei
视频图像采集和预处理系统的FPGA实现.rar

本文研究的视频处理系统是上海市科委技术攻关基金项目“计算机视觉及其芯片化实现”的一部分，主要完成计算机视觉系统的一些基本工作，即视频图像的采集、预处理和显示等。视频图像采集和预处理系统以Xilinx公司Virtex-ⅡPro系列的FPGA为核心控制器件，结合视频模数转换芯片和VGA显示器，完成视频图像的实时采集、预处理和显示。采集和显示部分作为同外界交流信息的渠道，是构成计算机视觉系统必不可少的一部分；图像预处理则是计算机视觉系统进行高层处理的基础，优秀的预处理算法能有效改善图像质量，提高系统分析判断的准确性。本文在介绍基于FPGA的视频采集、预处理系统整体架构的基础上，围绕以下四个方面展开了工作： 1.研究并给出了两种基于FPGA的设计方案用于实现YCrCb色度空间到RGB色度空间的转换； 2.针对采集的视频图像，根据VGA显示的要求，给出了一种实现图像去隔行的方案； 3.分析了一系列图像滤波的预处理算法，如均值滤波、中值滤波和自适应滤波等，在比较和总结各算法特点的基础上，提出了一种新的适用于处理混合噪声的滤波算法：混合自适应滤波法； 4.根据算法特点设计了多种采用FPGA实现的图像滤波算法，并对硬件算法进行Rtl级的功能仿真和验证，还给出了各种滤波算法的实验结果，在此基础上对各种算法的效果进行直观的比较。文中，预处理算法的实现充分利用了FPGA的片内资源，体现了FPGA在图像处理方面的特点及优势。同时，视频采集和显示的控制模块也由同一FPGA芯片实现，从而简化了系统整体结构。视频采集和预处理系统在FPGA上的成功实现为“计算机视觉及其芯片化实现”奠定了必要的基础、提供了一定理论依据。

标签： FPGA 视频图像

上传时间： 2013-07-25

上传用户：alia
USB接口引擎的软核设计与FPGA兑现.rar

USB(UniversalSerialBus，通用串行总线)是当今消费电子产品和仪器设备中应用最广的接口协议之一，然而目前国内的USB芯片只有极少数几款，产品研究善处于起步阶段，绝大部分产品主要由国外的IC设计芯片厂商如Cypress、NEC等一些国际著名公司提供。因而，如果能够自主开发设计USB芯片以替代国外同类产品，将会有很好的市场前景和利润空间。本论文课题是针对基于FPGA(FieldProgrammableGateArray，现场可编程门阵列器件)的数字电子产品应用设计一种实际可复用的USB接口引擎软核。该软核主要是用于处理USB标准协议包的通信处理，通过外接MCU(MultipointControlUnit，微控制器)就可以实现完整的USB接口通讯功能。它的功能相当于一些USB引擎的专用芯片如：Philips的PDIUSBD12等，其优点是结构简单、灵活性高、复用设计方便。功能仿真和综合测试结果显示本论文所设计的接口引擎软核符合设计要求，并且软核的性能和市场上同类产品基本一致。本论文的创新之处在于：1、从可配置性角度出发设计了低速、全速、高速三种可选模式；2、支持最多31个可配置端点；3、采用了可综合、可移植的Rtl(RegisterTransferLevel，寄存器传输级)代码设计规则，同时也开发了可综合的验证测试代码；4、完全由硬件实现USB通信功能。

标签： FPGA USB 接口

上传时间： 2013-07-18

上传用户：JasonC
基于运动补偿的去隔行系统的研究与FPGA设计

本文采用基于运动补偿的算法,对去隔行系统及其FPGA设计作了深入的研究.该系统包括三个关键模块运动估计模块是去隔行系统的设计重点,设计为双向运动估计,采用菱形快速搜索算法,主要分为计算和控制两大部分.计算部分为SAD计算模块,采用累加树和流水线技术;控制部分根据菱形搜索算法的第三步搜索的特点,对比较模块、SAD暂存器等模块做了具体的设计.对于运动补偿模块采用双向补偿的算法,补偿精度为半像素.根据半像素点的位置将运动补偿计算分为四个状态,并通过对四个状态计算特点的分析设计了加法器的结构复用.同时基于视频数据处理的需要,设计了四个具有双体存储结构的内部缓存器,由FPGA内部的嵌入式阵列块实现.根据运动估计模块和运动补偿模块的计算特点,分别对缓存器的结构、读写时序和列序号控制进行设计,有效提高了数据的存取效率.本文对于这三个去隔行系统的关键模块都给出了Rtl级设计和模块的功能仿真,并在最后一章中给出了去隔行系统的FPGA设计.

标签： FPGA 补偿去隔行

上传时间： 2013-06-11

上传用户：han_zh
JPEG2000二维离散小波变换快速算法研究和FPGA实现

相对于JPEG中二维离散余弦变换(2DDCT)来说，在JPEG2000标准中，二维离散小波变换(2DDWT)是其图像压缩系统的核心变换。在很多需要进行实时处理图像的系统中，如数码相机、遥感遥测、卫星通信、多媒体通信、便携式摄像机、移动通信等系统，需要用芯片实现图像的编解码压缩过程。虽然有许多研究工作者对图像处理的小波变换进行了研究，但大都只偏重算法研究，对算法硬件实现时的复杂性考虑较少，对图像处理的小波变换硬件实现的研究也较少。　　本文针对图像处理的小波变换算法及其硬件实现进行了研究。对文献[13]提出的“内嵌延拓提升小波变换”(Combiningthedata-extensionprocedureintothelifting-basedDWTcore)快速算法进行仔细分析，提出一种基于提升方式的5/3小波变换适合硬件实现的算法，在MATLAB中仿真验证了该算法，证明其是正确的。并设计了该算法的硬件结构，在MATLAT的Simulink中进行仿真，对该结构进行VHDL语言的寄存器传输级(Rtl)描述与仿真，成功综合到Altera公司的FPGA器件中进行验证通过。本算法与传统的小波变换的边界处理方法比较：由于将其边界延拓过程内嵌于小波变换模块中，使该硬件结构无需额外的边界延拓过程，减少小波变换过程中对内存的读写量，从而达到减少内存使用量，降低功耗，提高硬件利用率和运算速度的特点。本算法与文献[13]提出的算法相比较：无需增加额外的硬件计算模块，又具有在硬件实现时不改变原来的提升小波算法的规则性结构的特点。这种小波变换硬件芯片的实现不仅适用于JPEG2000的5/3无损小波变换，当然也可用于其它各种实时图像压缩处理硬件系统。

标签： JPEG 2000 FPGA 二维

上传时间： 2013-06-13

上传用户：jhksyghr
嵌入式USB总线器件端处理器的FPGA实现研究

　　本文提出了一种适合于嵌入式SoC的USB器件端处理器的硬件实现结构。并主要研究了USB器件端处理器的Rtl级实现及FPGA原型验证、和ASIC实现研究，包括从模型建立、算法仿真、各个模块的Rtl级设计及仿真、FPGA的下载测试和ASIC的综合分析。它的速度满足预定的48MHz，等效门面积不超过1万门，完全可应用于SOC设计中。　　本文重点对嵌入式USB器件端处理器的FPGA实现作了研究。为了准确测试本处理器的运行情况，本文应用串口传递测试数据入FPGA开发板，测试模块读入测试数据，发送入PC机的主机端。通过NI-VISA充当软件端，检验测试数据的正确。　　　　

标签： FPGA USB 嵌入式器件

上传时间： 2013-07-23

上传用户：1079836864
图象压缩系统中熵编解码器的FPGA设计及实现

随着移动终端、多媒体、Internet网络、通信，图像扫描技术的发展，以及人们对图象分辨率，质量要求的不断提高，用软件压缩难以达到实时性要求，而且会带来因传输大量原始图象数据带来的带宽要求，因此采用硬件实现图象压缩已成为一种必然趋势。而熵编码单元作为图像变换，量化后的处理环节，是图像压缩中必不可少的部分。研究熵编解码器的硬件实现，具有广阔的应用背景。本文以星载视频图像压缩的硬件实现项目为背景，对熵编码器和解码器的硬件实现进行探讨，给出了并行熵编码和解码器的实现方案。熵编解码器中的难点是huffman编解码器的实现。在设计并行huffman编码方案时通过改善Huffman编码器中变长码流向定长码流转换时的控制逻辑,避免了因数据处理不及时造成数据丢失的可能性，从而保证了编码的正确性。而在实现并行的huffman解码器时，解码算法充分利用了规则化码书带来的码字的单调性，及在特定长度码字集内码字变化的连续性，将并行解码由模式匹配转换为算术运算，提高了存储器的利用率、系统的解码效率和速度。在实现并行huffman编码的基础上，结合针对DC子带的预测编码，针对直流子带的游程编码，能够对图像压缩系统中经过DWT变换，量化，扫描后的数据进行正确的编码。同时，在并行huffman解码基础上的熵解码器也可以解码出正确的数据提供给解码系统的后续反量化模块，进一步处理。在本文介绍的设计方案中，按照自顶向下的设计方法，对星载图像压缩系统中的熵编解码器进行分析，进而进行逻辑功能分割及模块划分，然后分别实现各子模块，并最终完成整个系统。在设计过程中，用高级硬件描述语言verilogHDL进行Rtl级描述。利用了Altera公司的QuartusII开发平台进行设计输入、编译、仿真，同时还采用modelsim仿真工具和symplicity的综合工具，验证了设计的正确性。通过系统波形仿真和下板验证熵编码器最高频率可以达到127M，在62.5M的情况下工作正常。而熵解码器也可正常工作在62.5M，吞吐量可达到2500Mbps，也能满足性能要求。仿真验证的结果表明：设计能够满足性能要求，并具有一定的使用价值。

标签： FPGA 图象压缩熵

上传时间： 2013-05-18

上传用户：吴之波123
基于ARM的PCI北桥设计与验证

PCI(Peripheral Component Interconnect)总线以其高性能、低成本、开放性、独立于处理器、软件透明等众多优点成为当今最流行的计算机局部总线。在嵌入式系统领域中，许多IP都是基于PCI总线设计的。本文阐述一种以ARM9作为CPU的嵌入式系统的PCI北桥设计与验证。首先介绍基于ARM的嵌入式系统结构，并深入研究PCI2.2总线行为规范。在此基础上提出一种基于ARM处理器的PCI总线北桥的设计方案，整个设计主要分为主设备接口模块，目标设备接口模块，配置寄存器模块和集成总线仲裁器三大部分。对于主设备接口模块和目标设备接口模块，论文主要从数据通路和控制路径的实现两方面进行阐述。对于集成的总线仲裁器，设计采用两优先级的循环优先算法，通过一组设备编号寄存器实现了PCI总线上的仲裁，此外，论文对跨时钟域的信号同步和PCI配置寄存器也作了较为详细的描述，最终采用自顶向下的方法实现了整个设计。在验证部分，引入了基于平台的验证思路，通过搭建验证平台，可以高效地实现验证。论文重点讨论了验证平台的搭建和行为模型的建立，并介绍了一种命令总线，通过打包各个验证点控制验证流程。此外，为提高验证的自动化程度，论文对验证所使用的脚本也进行了描述。通过此验证平台和脚本，提高了整个验证系统的可移植性和可重用性。论文最终完成了PCI北桥的Rtl级的功能描述，并使用仿真软件完成对设计的仿真验证。设计通过验证并成功实现在基于ARM的集成处理器，达到预定的功能设计要求，并具有良好的性能，最后对后续开发进行了探讨。

标签： ARM PCI 北桥

上传时间： 2013-05-21

上传用户：uuuuuuu