纹理映射在计算机图形计算中属于光栅化阶段,处理的是像素,主要的特点是数据的吞吐量大,对实时系统来说转换的速度是一个关键的因素,人们寻求各种加速算法来提高运算速度。传统的方法是用更快的处理器,并行算法或专用硬件。随着数字技术的发展,尤其是可编程逻辑门阵列(FPGAs)的发展,提供了一种新的加速方法。FPGAs在密度和性能上都有突破性的发展,当前的FPGA芯片已经能够运算各种图形算法,而在速度上与专用的图形卡硬件相同。因此,FPGA芯片非常适合这项工作。 本文主要工作包括以下几个方面: 1、本文提出了一种MIPmapping纹理映射优化方法,改进了MIPmapping映射细化层次算法及纹理图像的存储方式,减少纹理寻址的计算量,提高纹理存储的相关性。详细内容请阅读第三章。 2、提出了一种MIPmapping纹理映射优化方法的硬件实现方案,该方案针对移动设备对功耗和面积的要求,以及分辨率不高的特点,在参数空间到纹理地址的计算中用定点数来实现。详细内容请阅读第四章。 3、实现了纹理映射流水线单元纹理地址产生电路,及纹理滤波电路的FPGA设计,并给出设计的综合和仿真结果。详细内容请阅读第五章4、实现了符合IEEE 754单精度标准的乘法、乘累加及除法运算器电路。乘法器采用改进型Booth编码电路以减少部分积数量,用Wallace对部分积进行压缩;乘累加器采用multiply-add fused算法,对关键路径进行了优化;除法器为基于改进型泰勒级数展开的查找表结构实现,查找表尺寸只有208字节,电路为固定时延,在电路尺寸、延时及复杂度方面进行了较好的平衡。
上传时间: 2013-04-24
上传用户:yxvideo
针对单件车间调度问题,设计一种基于整数编码的单亲遗传算法。该算法既具有单亲遗传算法运算量小、不存在“早熟收敛”现象等优点,在编码中又体现了单件车间调度的“保序性”等工艺约束条件,增强了调度算法的整体性
上传时间: 2013-04-24
上传用户:笨小孩
在超深亚微米技术工艺下,布局成为超大规模集成电路物理设计中至关重要的一步。由于现场可编程门阵列(Field Programable Gate Array,FPGA)布线资源的预先确定性,使得FPGA的布局更为重要。本文以建立高性能、低拥挤的布局为目标,从FPGA芯片结构和布局算法两方面进行了深入研究。论文提出了一种通用的层次式FPGA(HFPGA)结构模型及布局模型,并且给出了该模型的数学计算公式;提出将元件之间的层次距离转化为线长的方法,实现了基于线网模型的高精度布局算法:提出利用矩形的对角线元件之间层次来代替线长,从而达到优化线长的同时提高布通率的快速布局算法。实验结果表明,两种算法均在北卡罗来纳微电子中心(MCNC)学术芯片测试案例上取得了较理想的布局实验效果,为下一步的布线工作建立了良好的基础接口,并且完成了初始布线的工作。本FPGA结构模型的提出和布局算法的实现也都为工业界提供了借鉴价值。
上传时间: 2013-04-24
上传用户:nbdedu
随着各种通信系统数量的日益增多,为了充分地利用有限的频谱资源,高频谱利用率的调制技术不断被应用。偏移正交相移键控(OQPSK: Offset QuadraturePhase Shift Keying)是一种恒包络调制技术,具有较高的频谱利用率和功率利用率,广泛应用于卫星通信系统和地面移动通信系统。因此,对于OQPSK全数字解调技术的研究具有一定的理论价值。 本文以软件无线电和全数字解调的相关理论为指导,成功设计并实现了基于FPGA的OQPSK全数字解调。论文介绍了OQPSK全数字接收解调原理和基于软件无线电设计思想的全数字接收机的基本结构,详细阐述了当今OQPSK数字解调中载波频率同步、载波相位同步、时钟同步和数据帧同步的一些常用算法,并选择了相应算法构建了三种系统级的实现方案。通过MATLAB对解调方案的仿真和性能分析,确定了FPGA中的系统实现方案。在此基础上,本文采用VerilogHDL硬件描述语言在Altera公司的Quartus II开发平台上设计了同步解调系统中的各个模块,还对各模块和整个系统在ModelSim中进行了时序仿真验证,并对设计中出现的问题进行了修正。最后,经过FPGA调试工具嵌入式逻辑分析仪SignalTapⅡ的硬件实际测试,本文对系统方案进行了最终的改进与调整。 实际测试结果表明,本文的设计最终能够达到了预期的指标和要求。本课题设计经过时序和资源优化后还可以向ASIC和系统级SOC转化,以进一步缩小系统体积、降低成本和提高电路的可靠性,因此具有良好的实际应用价值。
上传时间: 2013-07-14
上传用户:aappkkee
遗传算法是一种基于自然选择原理的优化算法,在很多领域有着广泛的应用。但是,遗传算法使用计算机软件实现时,会随着问题复杂度和求解精度要求的提高,产生很大的计算延时,这种计算的延时限制了遗传算法在很多实时性要求较高场合的应用。为了提升运行速度,可以使用FPGA作为硬件平台,设计数字系统完成遗传算法。和软件实现相比,硬件实现尽管在实时性和并行性方面具有很大优势,但同时会导致系统的灵活性不足、通用性不强。本文针对上述矛盾,使用基于功能的模块化思想,将基于FPGA的遗传算法硬件平台划分成两类模块:系统功能模块和算子功能模块。针对不同问题,可以在保持系统功能模块不变的前提下,选择不同的遗传算子功能模块完成所需要的优化运算。本文基于Xilinx公司的Virtex5系列FPGA平台,使用VerilogHDL语言实现了伪随机数发生模块、随机数接口模块、存储器接口/控制模块和系统控制模块等系统功能模块,以及基本位交叉算子模块、PMX交叉算子模块、基本位变异算子模块、交换变异算子模块和逆转变异算子模块等遗传算法功能模块,构建了系统功能构架和遗传算子库。该设计方法不仅使遗传算法平台在解决问题时具有更高的灵活性和通用性,而且维持了系统架构的稳定。本文设计了多峰值、不连续、不可导函数的极值问题和16座城市的旅行商问题 (TSP)对遗传算法硬件平台进行了测试。根据测试结果,该硬件平台表现良好,所求取的最优解误差均在1%以内。相对于软件实现,该系统在求解一些复杂问题时,速度可以提高2个数量级。最后,本文使用FPGA实现了粗粒度并行遗传算法模型,并用于 TSP问题的求解。将硬件平台的运行速度在上述基础上提高了近1倍,取得了显著的效果。关键词:遗传算法,硬件实现,并行设计,FPGA,TSP
上传时间: 2013-06-15
上传用户:hakim
随着多媒体技术的发展,数字图像处理已经成为众多应用系统的核心和基础。它的发展主要依赖于两个性质不同、自成体系但又紧密相关的研究领域:图像处理算法及其相应的电路实现。图像处理系统的硬件实现—般有三种方式:专用的图像处理器件集成芯片(Application Specific Integrated Circuit)、数字信号处理器(Digital Signal Process)和现场可编程门阵列(Field Programmable Gate Array)以及相关电路组成。它们可以实时高速完成各种图像处理算法。图像处理中,低层的图像预处理的数据量很大,要求处理速度快,但运算结果相对比较简单。相对于其他两种方式,基于FPGA的图像处理方式的系统更适合于图像的预处理。本文设计了—种基于FPGA的小波域图像去噪系统。首先,阐述了基于小波变换的图像去噪算法原理,重点讨论了小波邻域阈值(NeighShrink)去噪算法,并给出了该算法相应的Matlab 仿真;然后,为了改进邻域阈值去噪算法中对每个分解子带都采用相同邻域和阈值的缺点,本文提出了基于最小二乘支持向量机(LS-SVM)分类的邻域阈值去噪算法和以斯坦无偏估计 (SURE)为准则同时结合小波系数尺度间关系的邻域阈值去噪算法。经Matlab实验表明,相比于其他几种经典算法,本文提出的两种改进算法在滤除噪声的同时能更好地保护图像细节,并在较高噪声情况下能获得更高的峰值信噪比。在此基础上本文将提出的改进小波邻域阈值去噪算法进行了相应的简化,以满足低噪声处理要求且易于在FPGA上实现;最后,给出了基于 FPGA的小波邻域阈值去噪系统的总体结构和FPGA内部各功能模块的具体实现方案,包括二维离散小波变换模块、二维离散小波逆变换模块、SDRAM存储器控制模块、去噪计算模块和系统核心控制模块,并对各个系统模块和整体进行了仿真验证,结果表明本文设计的基于FPGA 的小波邻域阈值去噪系统能满足实际的图像处理要求,具有一定的理论和实际应用价值。关键词:图像处理系统,FPGA,图像去噪算法,小波变换
上传时间: 2013-05-16
上传用户:450976175
FPGA布局算法和软件位于工艺映射和布线之间,是一个承上启下的阶段,对最终的布通率和时序都有着重要的影响。 本论文的工作之一便是研究旨在提高布通率的布局算法。在研究了国内外装箱和布局算法的基础上,本文提出了一种新的结合了装箱的布局算法框架,并称之为"低温交替改善的"布局算法。其基本思想是,在模拟退火的低温阶段交替的优化装箱和布局。本文给了基于学术界标准布局布线软件VPR的一个软件实现,并且提出了低温的判定条件以及一种新的选择待交换逻辑单元的方法。采用三种不同的装箱算法作为布局输入,基于VPR的低温交替改善的布局算法实现,在布通率上,比VPR分别提高了21.3%、15.5%、10.7%。而带来的平均额外时间开销不到20%。 FPGA布局软件实现对整个FPGA CAD流程的运行效率,算法的可扩展性也有着不可忽视的影响。现代FPGA有着多样而复杂的逻辑和布线资源。而学术界的布局软件'VPR所面向的FPGA却只能处理十分简单的FPGA结构,对于宏、总线、多时钟等实际应用中很重要的部分都没有考虑。本文提出了"逻辑单元层"的概念,用具有特定几何结构的逻辑单元层来统一处理多种类型的逻辑资源。针对相对位置约束在现代FPGA布局软件中的重要地位,我们提出了一种处理相对位置约束的方法。这些讨论均已经在面向Xilinx SpartanⅡ芯片布局的原型系统中得到了实现,初步证实了这些方法的可扩展性和实用性。
上传时间: 2013-06-21
上传用户:ezgame
本文对嵌入硬核的FPGA布线通道宽度分布和改进FPGA布局算法进行了研究。文章在嵌入硬核的FPGA布线通道宽度分布研究中,引入了四种架构,其布线通道宽度分布函数分别为均匀、脉冲、高斯和三角分布。通过修改VPR工具的源代码,使平台适用于具有嵌入硬核的FPGA架构,利用MCNC基准电路来测试这四种架构的性能。实验结果表明:在以网线平均长度作为指标的测试中,通道宽度均匀分布的架构具有更短的布线长度、更优的性能。
上传时间: 2013-06-27
上传用户:xsnjzljj
本课题涉及先进的FPGA技术引入到数控插补時某些算法的改进,主要目的是更好的利用FPGA具有系统芯片化、高可靠性、开发设计周期短等特点,及具有系统内可再编程的性能,来解决目前软件插补速度慢而硬件插补设计复杂、调整和修...
上传时间: 2013-04-24
上传用户:gjzeus
论文研究了基于Bayer格式的CCD原始图像的颜色插值算法,并将设计的改进算法应用到以FPGA为核心的图像采集前端。出于对成本和体积的考虑,一般的数字图像采集系统采用单片CCD或CMOS图像传感器,然后在感光表面覆盖一层颜色滤波阵列(CFA),经过CFA后每个像素点只能获得物理三基色(红、绿、蓝)其中一种分量,形成马赛克图像。为了获得全彩色图像,就要利用周围像素点的值近似地计算出被滤掉的颜色分量,称这个过程为颜色插值。由于当前对图像采集系统的实时性要求越来越高,业内已经开始广泛采用FPGA来进行图像处理,充分发挥硬件并行运算的速度优势,以求在处理速度和成像质量两方面均达到满意的效果。。主要的工作内容如下: 本文首先介绍了彩色滤波阵列、图像色彩恢复和插值算法的概念,然后分析和研究了当下常用的颜色插值算法,如双线性插值算法、加权系数法等等,指出了各个算法的特点和不足;接下来针对硬件系统并行运算的特性和实时性处理的要求,结合其中两种算法的思路设计了适用于硬件的改进算法,该算法主要引入了方向标志位的概念以及平滑的边界仲裁法则来检测边界,借鉴利用梯度的三角函数关系来判断边界方向,通过简化且适用于硬件的方法计算加权系数,从而选择合适的方向进行插值。 在介绍了FPGA用于图像处理的优势后,针对FPGA的特点采用模块化结构设计,详细阐述了本文算法的软件实现过程及所使用到的关键技术;文章设计了一个以FPGA为核心的前端图像采集平台,并将改进插值算法应用到整个系统当中。详细分析了采集前端的硬件需求,讨论了核心芯片的选型和硬件平台设计中的注意事项,完成了印制电路板的制作。 文章通过MATLAB仿真得到了量化的性能评估数据,并选取几种算法在硬件平台上运行,得到了实验图片。最后结合图片的视觉效果和仿真数据对几种不同算法的效果进行了评估和比较,证明改进的算法对图像质量有所增强,取得了良好的效果。
上传时间: 2013-06-11
上传用户:it男一枚