多核处理器

多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)，此时处理器能支持系统总线上的多个处理器，由总线控制器提供所有总线控制信号和命令信号。多核技术的开发源于工程师们认识到，仅仅提高单核芯片的速度会产生过多热量且无法带来相应的性能改善，先前的处理器产品就是如此。他们认识到，在先前产品中以那种速率，处理器产生的热量很快会超过太阳表面。即便是没有热量问题，其性价比也令人难以接受，速度稍快的处理器价格要高很多。

基于FPGA/CPLD实现的FFT算法与仿真分析

可编程逻辑器件FPGA(现场可编程门阵列)和CPLD(复杂可编程逻辑器件)越来越多的应用于数字信号处理领域，与传统的ASIC(专用集成电路)和DSP(数字信号处理器)相比，基于FPGA和CPLD实现的数字信号处理系统具有更高的实时性和可嵌入性，能够方便地实现系统的集成与功能扩展。 FFT的硬件结构主要包括蝶形处理器、存储单元、地址生成单元与控制单元。本文提出的算法在蝶形处理器内引入流水线结构，提高了FFT的运算速度。同时，流水线寄存器能够寄存蝶形运算中的公共项，这样在设计蝶形处理器时只用到了一个乘法器和两个加法器，降低了硬件电路的复杂度。为了进一步提高FFT的运算速度，本文在深入研究各种乘法器算法的基础上，为蝶形处理器设计了一个并行乘法器。在实现该乘法器时，本文采用改进的布斯算法，用以减少部分积的个数。同时，使用华莱士树结构和4-2压缩器对部分积并行相加。本文以32点复数FFT为例进行设计与逻辑综合。通过设计相应的存储单元，地址生成单元和控制单元完成FFT电路。电路的仿真结果与软件计算结果相符，证明了本文所提出的算法的正确性。另外，本文还对设计结果提出了进一步的改进方案，在乘法器内加入一级流水线寄存器，使FFT的速度能够提高到当前速度的两倍，这在实时性要求较高的场合具有极高的实用价值。

标签： FPGA CPLD FFT 算法

上传时间： 2013-07-18

上传用户：wpt
基于WEB实现FPGA的远程多路数据采集系统

　　本文首先研究了常规的数据采集的方法，针对由单片机构成的数据采集系统数据处理能力弱的问题提出了基于现场可编程门阵列(FieldProgrammableGateArray,FPGA)为逻辑控制芯片对三片A/D芯片进行控制的远程多路数据采集的解决方案。本文利用VisualBasic编写串口通信程序，通过串行端口向FPGA数据采集板发送数据采集的参数指令,FPGA数据采集板接受指令后进行现场数据采集，并通过串行通信将数据发送到PC机，在通信过程中完全遵守RS-232协议，具有较强的通用性和推广价值。然后本文重点介绍了该采集系统的硬件设计原理和软件设计框架，实现实时嵌入式微机数据采集系统的软件和硬件设计方法，将部分软件的功能改由硬件实现，从逻辑上大大简化了嵌入式软件的设计。

标签： FPGA WEB 远程多路数据采集

上传时间： 2013-04-24

上传用户：yaohe123
基于WEB实现FPGA的远程多路数据采集系统

　　本文首先研究了常规的数据采集的方法，针对由单片机构成的数据采集系统数据处理能力弱的问题提出了基于现场可编程门阵列(FieldProgrammableGateArray,FPGA)为逻辑控制芯片对三片A/D芯片进行控制的远程多路数据采集的解决方案。本文利用VisualBasic编写串口通信程序，通过串行端口向FPGA数据采集板发送数据采集的参数指令,FPGA数据采集板接受指令后进行现场数据采集，并通过串行通信将数据发送到PC机，在通信过程中完全遵守RS-232协议，具有较强的通用性和推广价值。然后本文重点介绍了该采集系统的硬件设计原理和软件设计框架，实现实时嵌入式微机数据采集系统的软件和硬件设计方法，将部分软件的功能改由硬件实现，从逻辑上大大简化了嵌入式软件的设计。

标签： FPGA WEB 远程多路数据采集

上传时间： 2013-05-30

上传用户：1193169035
用FPGA实现“共轭变换”图像处理方法

近年来微光、红外、X光图像传感器在军事、科研、工农业生产、医疗卫生等领域的应用越来越为广泛，但由于这些成像器件自身的物理缺陷，视觉效果很不理想，往往需要对图像进行适当的处理，以得到适合人眼观察或机器识别的图像。因此，市场急需大量高效的实时图像处理器能够在传感器后端对这类图像进行处理。而FPGA的出现，恰恰解决了这个问题。近十年来，随着FPGA(现场可编程门阵列)技术的突飞猛进，FPGA也逐渐进入数字信号处理领域，尤其在实时图像处理方面。Xilinx的研究表明，在2000年主要用于DSP应用的FPGA的发货量，增长了50％；而常规的DSP大约增长了40％。由于FPGA可无比拟的并行处理能力，使得FPGA在图像处理领域的应用持续上升，国内外，越来越多的实时图像处理应用都转向了FPGA平台。与PDSP相比，FPGA将在未来统治更多前端(如传感器)应用，而PDSP将会侧重于复杂算法的应用领域。可以说，FPGA是数字信号处理的一次重大变革。算法是图像处理应用的灵魂，是硬件得以发挥其强大功能的根本。”共轭变换”图像处理方法是一种新型的图像处理算法，由郑智捷博士上个世纪90年代初提出。这种算法使用基元形状(meta-shape)技术，而这种技术的特征正好具备几何与拓扑的双重特性，使得大量不同的基于形态的灰度图像处理滤波器可用这种方法实现。该种算法在空域进行图像处理，无需进行大量复杂的算术运算，算法简单、快速、高效，易于硬件实现。通过十多年来的实验与实践证明，在微光图像，红外图像，X光图像处理领域，”共轭变换”图像处理方法确实有其独特的优异性能。本篇论文就针对”共轭变换”图像处理方法在微光图像处理领域的应用，就如何在FPGA上实现”共轭变换”图像处理方法展开研究。首先在Matlab环境下，对常用的图像增强算法和”共轭变换”图像处理方法进行了比较，并且在设计制作“FPGA视频处理开发平台”的基础上，用VHDL实现了”共轭变换”图像处理方法的基本内核并进行了算法的硬件实现与效果验证。此外，本文还详细地讨论了视频流的采集及其编码解码问题以及I2C总线的FPGA实现。

标签： FPGA 共轭变换图像处理方法

上传时间： 2013-04-24

上传用户：CHENKAI
基于FPGA的音频处理器的设计与实现

本文分析了数字音频处理技术中数字滤波器的各种传统实现算法,尤其是研究了FIR数字滤波器的实现算法,在分析了数字滤波器的传统算法的基础上,针对家用和便携式音频处理系统,提供一种基于FPGA的音频处理器的实现方案,以适应便携式和家用设备对处理器体积和功耗小的发展要求.该方案对实现N阶FIR数字滤波器的传统算法进行了改良,将滤波器的系数用浮点数表示法来表示,使得原本至少需要一个乘法器和一个加法器来实现滤波功能,现在仅需要若干次加法和移位运算就可以实现,很大程度降低了设计的复杂度和系统功耗,也减少了芯片的面积.同时采用硬件描述语言VHDL实现了音频处理器各个模块的设计.

标签： FPGA 音频处理器

上传时间： 2013-06-02

上传用户：cknck
采用FPGA实现基于ATCA架构的2.5Gbps串行背板接口

当前，在系统级互连设计中高速串行I/O技术迅速取代传统的并行I/O技术正成为业界趋势。人们已经意识到串行I/O“潮流”是不可避免的，因为在高于1Gbps的速度下，并行I/O方案已经达到了物理极限，不能再提供可靠和经济的信号同步方法。基于串行I/O的设计带来许多传统并行方法所无法提供的优点，包括：更少的器件引脚、更低的电路板空间要求、减少印刷电路板（PCB）层数、PCB布局布线更容易、接头更小、EMI更少，而且抵抗噪声的能力也更好。高速串行I/O技术正被越来越广泛地应用于各种系统设计中，包括PC、消费电子、海量存储、服务器、通信网络、工业计算和控制、测试设备等。迄今业界已经发展出了多种串行系统接口标准，如PCI Express、串行RapidIO、InfiniBand、千兆以太网、10G以太网XAUI、串行ATA等等。 Aurora协议是为私有上层协议或标准上层协议提供透明接口的串行互连协议，它允许任何数据分组通过Aurora协议封装并在芯片间、电路板间甚至机箱间传输。Aurora链路层协议在物理层采用千兆位串行技术，每物理通道的传输波特率可从622Mbps扩展到3.125Gbps。Aurora还可将1至16个物理通道绑定在一起形成一个虚拟链路。16个通道绑定而成的虚拟链路可提供50Gbps的传输波特率和最大40Gbps的全双工数据传输速率。Aurora可优化支持范围广泛的应用，如太位级路由器和交换机、远程接入交换机、HDTV广播系统、分布式服务器和存储子系统等需要极高数据传输速率的应用。传统的标准背板如VME总线和CompactPCI总线都是采用并行总线方式。然而对带宽需求的不断增加使新兴的高速串行总线背板正在逐渐取代传统的并行总线背板。现在，高速串行背板速率普遍从622Mbps到3.125Gbps，甚至超过10Gbps。AdvancedTCA（先进电信计算架构）正是在这种背景下作为新一代的标准背板平台被提出并得到快速的发展。它由PCI工业计算机制造商协会（PICMG）开发，其主要目的是定义一种开放的通信和计算架构，使它们能被方便而迅速地集成，满足高性能系统业务的要求。ATCA作为标准串行总线结构，支持高速互联、不同背板拓扑、高信号密度、标准机械与电气特性、足够步线长度等特性，满足当前和未来高系统带宽的要求。采用FPGA设计高速串行接口将为设计带来巨大的灵活性和可扩展能力。Xilinx Virtex-IIPro系列FPGA芯片内置了最多24个RocketIO收发器，提供从622Mbps到3.125Gbps的数据速率并支持所有新兴的高速串行I/O接口标准。结合其强大的逻辑处理能力、丰富的IP核心支持和内置PowerPC处理器，为企业从并行连接向串行连接的过渡提供了一个理想的连接平台。本文论述了采用Xilinx Virtex-IIPro FPGA设计传输速率为2.5Gbps的高速串行背板接口，该背板接口完全符合PICMG3.0规范。本文对串行高速通道技术的发展背景、现状及应用进行了简要的介绍和分析，详细分析了所涉及到的主要技术包括线路编解码、控制字符、逗点检测、扰码、时钟校正、通道绑定、预加重等。同时对AdvancedTCA规范以及Aurora链路层协议进行了分析，并在此基础上给出了FPGA的设计方法。最后介绍了基于Virtex-IIPro FPGA的ATCA接口板和MultiBERT设计工具，可在标准ATCA机框内完成单通道速率为2.5Gbps的全网格互联。

标签： FPGA ATCA Gbps 2.5

上传时间： 2013-05-29

上传用户：frank1234
嵌入式USB总线器件端处理器的FPGA实现研究

　　本文提出了一种适合于嵌入式SoC的USB器件端处理器的硬件实现结构。并主要研究了USB器件端处理器的RTL级实现及FPGA原型验证、和ASIC实现研究，包括从模型建立、算法仿真、各个模块的RTL级设计及仿真、FPGA的下载测试和ASIC的综合分析。它的速度满足预定的48MHz，等效门面积不超过1万门，完全可应用于SOC设计中。　　本文重点对嵌入式USB器件端处理器的FPGA实现作了研究。为了准确测试本处理器的运行情况，本文应用串口传递测试数据入FPGA开发板，测试模块读入测试数据，发送入PC机的主机端。通过NI-VISA充当软件端，检验测试数据的正确。　　　　

标签： FPGA USB 嵌入式器件

上传时间： 2013-07-24

上传用户：1079836864
指纹识别算法的研究及基于FPGA的硬件实现

随着图像处理和模式识别技术的进步，基于生物特征的识别技术成为蓬勃发展的高技术之一，根据IBG(InternationalBiometricGroup)组织对生物特征市场的统计和预测，该领域的收入的年增长率30-50％，到2008年，全球总收入将达到46.39亿美元。而基于指纹特征的识别技术由于其独特的可靠性，稳定性，方便快捷的特点，恰好符合了市场的需求。目前指纹识别技术是生物识别领域中应用最广泛的识别技术，也是研究与应用的一个热点。 SOPC片上可编程系统和嵌入式系统是当前电子设计领域中最热门的概念。NiosⅡ是Altera公司开发的一种采用流水线技术、单指令流的RISC嵌入式处理器软核，可以将它嵌入FPGA内部，与用户自定义逻辑结合构成一个基于FPGA的片上系统。与嵌入式硬核相比较，嵌入式软核具有更大的灵活性。而FPGA的高速性、恰恰满足了指纹识别系统对速度的要求。本文对指纹识别技术中各个环节的算法进行了较为深入的研究，结合NiosⅡ嵌入式处理器的特点，对算法进行了合理的选择与优化，形成了一套完整的指纹识别算法，并提出了一种基于FPGA的指纹识别系统硬件设计方案。论文的内容主要包括以下几个方面： 1、对指纹图像预处理、后处理和匹配算法进行了改进，提高了算法的性能；设计了一种适用于快速匹配的指纹特征数据结构；提出了一套基于特征点匹配的指纹识别算法。实验结果表明该算法速度快、误识率较低、可靠性较高，可以满足实用的要求。 2、本着增加系统集成度、减小系统体积、提高便携性、降低功耗和成本，同时提升系统的性能的原则，使用Altera公司提供的外围设备IP核配合NiosⅡ处理器软核搭建了一个单片嵌入式系统，然后以内嵌NiosⅡ软核的FPGA和FPS200指纹采集器为核心芯片，外配片外RAM和Flash存储器以及小键盘和LCD显示屏等器件，设计了一个便携式指纹识别系统，提出了一套基于FPGA的硬件设计方案。 3、利用NiosⅡ开发板对硬件设计方案进行了初步的验证，实现了指纹采集芯片FPS200与FPGA的接口，并进行了算法的移植。实验结果表明本文所提出的系统设计方案是可行的。基于FPGA的自动指纹识别系统在速度、功耗、体积、扩展性方面有着独特的优势，具有广阔的发展空间。最后提出了对这一设计继续改进的思路和下一步研究的内容。

标签： FPGA 指纹识别法的研究硬件实现

上传时间： 2013-06-07

上传用户：kikye
基于DSP和FPGA的四关节实验室机器人控制器的研制

在机器人学的研究领域中，如何有效地提高机器人控制系统的控制性能始终是研究学者十分关注的一个重要内容。在分析了工业机器人的发展历程和机器人控制系统的研究现状后，本论文的主要目标是针对四关节实验室机器人特有的机械结构和数学模型，建立一个新型全数字的基于DSP和FPGA的机器人位置伺服控制系统的软、硬件平台，实现对四关节实验室机器人的精确控制。本论文从实际情况出发，首先分析了所研究的四关节实验室机器人的本体结构，并对其抽象简化得到了它的运动学数学模型。在明确了实现机器人精确位置伺服控制的控制原理后，我们对机器人控制系统的诸多可行性方案进行了充分论证，并最终决定采用了三级CPU控制的控制体系结构：第一级CPU为上位计算机，它实现对机器人的系统管理、协调控制以及完成机器人实时轨迹规划等控制算法的运算；第二级CPU为高性能的DSP处理器，它辅之以具有高速并行处理能力的FPGA芯片，实现了对机器人多个关节的高速并行驱动；第三级CPU为交流伺服驱动处理器，它实现了机器人关节伺服电机的精确三闭环误差驱动控制，以及电机的故障诊断和自动保护等功能。此外，我们采用比普通UART速度快得多的USB来实现上位计算机．与下位控制器之间的数据通信，这样既保证了两者之间连接方便，又有效的提高了控制系统的通信速度和可靠性。机器人系统的软件设计包括两个部分：一是采用VC++实现的上位监控软件系统，它主要负责机器人实时轨迹规划等控制算法的运算，同时完成用户与机器人系统之间的信息交互；二是采用C语言实现的下位DSP控制程序，它主要负责接收上位监控系统或者下位控制箱发送的控制信号，实现对机器人的实时驱动，同时还能够实时的向上位监控系统或者下位控制箱反馈机器人的当前状态信息。研究开发出来的四关节实验室机器人控制器具有控制实时性好、定位精度高、运行稳定可靠的特点，它允许用户通过上位控制计算机实现对机器人的各种设定作业的控制，也可以让用户通过机器人控制箱现场对机器人进行回零、示教等各项操作。

标签： FPGA DSP 实验室机器人控制器

上传时间： 2013-06-11

上传用户：edisonfather
基于FPGA的MPEG4协同处理器研究

网络带宽依然在不断增长（尤其是在本地网），最后一公里的高速接入日益普及;另一方面的情况是大容量的磁盘、FLASH移动存储盘和激光盘的容量不断增大，使得传送和储存数据的成本不断地下降。不仅使人发问：我们孜孜不倦的搞视频压缩高级算法还有多少意义？我们可以看到，算法的复杂性日益增加，但性能的提高却接近边缘。是什么还在要求更高的压缩速率？还有被我们遗忘的地方吗？还有什么应用让我们继续追求更精妙的压缩算法？在作者看来，这个应用领域就是移动视频服务。无线频谱这种稀缺资源的有限性决定了我们必须继续对视频压缩技术进行研究。即使伴随UMTS/IMT2000的到来，移动终端可以获得的数据速率也限制在144Kbit/s，在微蜂窝的时候最高能达到的速率上限也在2Mbit/s。144Kbit/s的速率对于较高质量的视频传输来讲，仍然是有限的。因此，可以预见，移动终端的空中接口这个瓶颈使得我们必须继续进行视频压缩。另一方面，移动终端领域开发视频压缩算法，在其低功耗和实时性要求下，也是异常困难的。为了减少计算的复杂性和运动估计的功耗，业界提出了许多快速算法，例如2-D的对数搜索，三步搜索，联合搜索。尽管这些方法减少了功耗，其结果是视频压缩性能的降低，因为这些算法的本质是减少了运动搜索的空间。为了实现运动搜索的低功耗，在电路领域又提出了搜索窗口和时钟管理的措施。但这些方法都是在牺牲视频压缩比性能的基础进行的折中，并没有强调算法映射结构上做出处理。本论文提出了一种新的解决MPEG-4运动估计运算的低功耗实时处理器架构。其基础是采用了心肌阵列并行处理技术和低功耗控制电路。运动估计的繁复运算通过心肌阵列分布式运算得到有效处理。从理论上看，心肌阵列有其简单易理解性，然后，由于FPGA的互联网络有限性，设计这样一个阵列仍有许多值得注意的问题。论文提出使用保守近似处理在全局运动估计中减少功耗，其本质是消除不必要的冗余运算。宏块的最小误差匹配是一个典型的串行操作过程。论文新提出的方法是在进行绝对匹配前使用保守计算，如果保守误差值与最小误差差别过大，则不进行绝对误差计算。总的说来，论文实现了两个目标：通过心肌阵列实现了实时的运动估计编码，通过在算法层次引入控制电路，降低运动估计电路的功耗。

标签： MPEG4 FPGA 处理器

上传时间： 2013-06-23

上传用户：lacsx