信道估计算法

基于ARM核嵌入式系统的AES算法优化

本文从AES的算法原理和基于ARM核嵌入式系统的开发着手，研究了AES算法的设计原则、数学知识、整体结构、算法描述以及AES存住的优点利局限性。针对ARM核的体系结构及特点，对AES算法进行了优化设计，提出了从AES算法本身和其结构两个方面进行优化的方法，在算法本身优化方面是把加密模块中的字节替换运算、列混合运算和解密模块中的逆列混合运算中原来的复杂的运算分别转换为简单的循环移位、乘和异或运算。在算法结构优化方面是在输入输山接口上采用了4个32位的寄存器对128bits数据进行了并行输入并行输出的优化设计；在密钥扩展上的优化设计是采用内部扩展，即在进行每一轮的运算过程的同时算出下一轮的密钥，并把下一轮的密钥暂存在SRAM里，使得密钥扩展与加/解密运算并行执行；加密和解密优化设计是将轮函数查表操作中的四个操作表查询工作合并成一个操作表查询工作，同时为了使加密代码在解密代码中可重用，节省硬件资源，在解密过程中采用了与加密相一致的过程顺序。根据上述的优化设计，基于ARM核嵌入式系统的ADS开发环境，提出了AES实现的软硬件方案、AES加密模块和解密模块的实现方案以及测试方案，总结了基于ARM下的高效编程技巧及混合接口规则，在集成开发环境下对算法进行了实现，分别得出了初始密钥为128bits、192bits和256bits下的加密与解密的结果，并得剑了正确验证。在性能测试的过程中应用编译器的优化选项和其它优化技巧优化了算法，使算法具有较高的加密速度。

标签： ARM AES 嵌入式系统算法优化

上传时间： 2013-04-24

上传用户：liansi
GPS接收机天线阵列抗干扰算法研究及其FPGA实现

GPS技术在导航、定位及精确打击等方面产生了重要影响，已经广泛地应用在各种武器平台上。但是，在干扰环境下也显现出许多问题。由于其到达地球表面的信号极其微弱(-160dBW)，在现在复杂的电磁环境中容易受到干扰，尤其是C/A码信号更易受到干扰，并且随着导航战的发展对GPS的抗干扰已成为争取导航资源的有效措施。因此，研究干扰环境下的GPS接收机设计具有重要意义。本文首先简要介绍了GPS信号的结构及构成，通过对GPS信号特征以及接收机抗干扰能力的分析，结合干扰对接收机的作用方式及效果，确定GPS最易受的干扰类型为阻塞式干扰，然后针对这种干扰类型提出了一种有效的抗干扰技术-----自适应调零天线技术。接下来，着重研究了GPS接收机在此抗干扰技术前提下的若干抗干扰方法，并对其进行了详细的分析和讨论。研究过程中，通过对最佳化准则和空域自适应滤波的理解，首先对不同天线阵列结构进行了性能仿真和比较分析，然后在对称圆形天线阵列的基础上对空域自适应算法进行了仿真分析，针对其自由度有限的问题接着对空时滤波方法做了详细讨论，在7元对称圆形阵列的基础上仿真说明了二者各自的优缺点。考虑到实际的干扰环境和本课题研究的初期阶段，因此选用了适合本课题干扰环境的空域滤波方法，并对其自适应算法进行了适当的改进，使得其抗干扰性能获得了一定程度的改善。最后，详细说明了该接收机抗干扰模块的FPGA实现原理。详细给出了顶层及各子模块的设计流程与RTL视图，实验结果验证了该算法的有效性。

标签： FPGA GPS 接收机天线阵列

上传时间： 2013-06-03

上传用户：xfbs821
H264AVC的CAVLC编码算法研究及FPGA实现

H.264/AVC是国际电信联盟与国际标准化组织/国际电工委员会联合推出的活动图像编码标准，简称H.264。作为最新的国际视频编码标准，H.264/AVC与MPEG-4、H.263等视频编码标准相比，性能有了很大的提高，并已在流媒体、数字电视、电话会议、视频存储等诸多领域得到广泛的应用。本论文的研究课题是基于H.264/AVC视频编码标准的CAVLC(Context-based Adaptive Variable Length Coding，基于上下文的自适应可变长编码)编码算法研究及FPGA实现。对于变换后的熵编码，H.264/AVC支持两种编码模式：基于上下文的可变长编码(CAVLC)和基于上下文的自适应算术编码(CABAC，Context-based Adaptive BinaryArithmetic Coding)。在H.264/AVC中，尽管CAVLC算法也是采用了VLC编码，但是同以往标准不同，它所有的编码都是基于上下文进行。这种方法比传统的查单一表的方法提高了编码效率，但也增加了设计上的困难。作者在全面学习H.264/AVC协议和深入研究CAVLC编码算法的基础上，确定了并行编码的CAVLC编码器结构框图，并总结出了影响CAVLC编码器实现的瓶颈。针对这些瓶颈，对CAVLC编码器中的各个功能模块进行了优化设计，这些优化设计包括多参考块的表格预测法、快速查找表法、算术消除法等。最后，用Verilog硬件描述语言对所设计的CAVLC编码器进行了描述，用EDA软件对其主要功能模块进行了仿真，并在Cyclone II系列EP2C20F484的FPGA上验证了它们的功能。结果表明，该CAVLC编码器各编码单元的编码速度得到了显著提高且均能满足实时通信要求，为整个CAVLC编码器的实时通信提供了良好的基础。

标签： CAVLC H264 FPGA 264

上传时间： 2013-06-04

上传用户：libenshu01
LDPC码译码器FPGA实现研究

LDPC码以其接近Shannon极限的优异性能在编码界引起了轰动，成为研究的热点。随着研究的不断深入和技术的发展，目前，LDPC码已经被多个通信系统定为信道编码方案，并被应用到第二代数字视频广播卫星(DVB—S2)通信系统中。由于LDPC码译码过程中所涉及的数据量庞大，译码时序控制复杂，如何实现LDPC码译码器成为了人们研究的重点。论文以基于FPGA实现LDPC码译码器为研究目标，主要对译码算法选择、译码数据量化、定点数据表示方式、译码算法关键运算单元的FPGA设计和译码的时序控制进行了深入研究。首先分析了LDPC码的基本译码原理和常用译码算法。然后重点分析了BP算法、Log-BP算法、最小和算法和归一化最小和算法，并对四种译码算法的纠错性能和译码复杂度进行比较论证，选出适合硬件实现的译码方案。结合通信系统，对译码算法进行仿真分析，确定了译码算法的各个参数值和译码量化方案。在系统仿真分析论证的基础之上，以归一化最小和译码算法为理论方案，利用硬件描述语言编写译码功能模块，并基于FPGA实现了固定译码长度的LDPC码译码器，利用MATLAB和Modelsim分别对译码器进行了功能验证和时序验证，最后模拟通信系统完成了译码器的硬件测试。

标签： LDPC FPGA 译码器实现研究

上传时间： 2013-04-24

上传用户：1234567890qqq
TDSCDMA频点拉远系统的FPGA设计与实现

随着TD—SCDMA技术的不断发展，TD—SCDMA系统产品也逐步成熟并随之完善。产品家族日益丰富，室内型宏基站、室外型宏基站、分布式基站(BBU+RRU)、微基站等系列化基站产品逐步问世，可以满足不同场景的建网需求。而分布式基站(BBU+RRU)越来越多地受到业界的关注和重视。本文主要从TD—SCDMA频点拉远系统(RRU)和软件无线电技术的发展入手，重点研究TD—SCDMA频点拉远系统的FPGA设计与实现。TD—SCDMA通信系统通过灵活分配不同的上下行时隙，实现业务的不对称性，但是多路数字中频所构成的系统成本高和控制的复杂性，以及TDD双工模式下，系统的峰均比随时隙数增加而增加，对整个频点拉远系统的前端放大器线性输入提出了很高的要求。TD—SCDMA系统使用软件无线电平台，一方面软件算法可以有效保证时隙分配的准确性，保证对前端控制器的开关控制，以及对上下行功率读取计算和子帧的灵活提取，另一方面灵活的DUC/CFR算法可以有效的提高频带利用率和抗干扰能力，有效的控制TDD系统的峰均比，有效降低系统对前端放大器线性输出能力的要求。本文主要研究软件无线电中DUC和CFR的关键技术以及FPGA实现，DUC主要由3倍FIR内插成型滤波器、2倍插值补偿滤波器以及5级CIC滤波器级联组成；而CFR主要采用类似基带削峰的加窗滤波的中频削峰算法，可以降低相邻信道的溢出，更有效的降低CF值。将DUC/CFR以单片FPGA实现，能很好提高RRU性能，减少其硬件结构，降低成本，降低功耗，增加外部环境的稳定性。

标签： TDSCDMA FPGA 频点

上传时间： 2013-04-24

上传用户：18752787361
常模算法的FPGA实现

常模信号是一类非常重要的信号，而专门应用于常模信号的常模算法[1]具有复杂度较低、实现起来比较简单、对阵列模型的偏差不敏感等显著的优点。因此，常模算法引起了众多学者的广泛关注。近年来，常模算法在多用户检测领域[2]的研究越来越受到诸多学者的关注。不仅如此，常模算法在其他领域也是备受瞩目，如常模算法在盲均衡以及波束形成等领域的应用也是目前研究的热点。除此之外，常模算法已经不仅仅局限在应用于常模信号，也可应用于多模信号[3]等。本文对常模算法在多用户检测领域的应用以及FPGA[4]实现作了较多的研究工作，共分六章进行阐述。第一章为绪论，介绍了论文相关背景和本文的结构；第二章首先对常模算法作了理论分析，并改进了传统的2-2型常模算法，我们称之为M2-2CMA，它在误码率性能上有一些改善；之后在MATLAB平台上搭建了仿真平台，分析了常模算法在多用户检测中的应用；第三章研究了相关文献，简单介绍了FPGA概念及其设计流程和设计方法，并对VerilogHDL以及Quartus软件做了简要介绍；第四章则详细介绍了常模算法的FPGA实现，用一种基于统计数据的方法确定了数据位长及精度，提出了其实现的系统框图，并详细阐述了各主要模块的设计与实现，同时给出了最后的报告文件以及最高数据处理速度；第五章则在MATLAB平台和QuartuslI的基础上搭建了一个仿真平台，借助于平台分析了2-2型常模算法移植到FPGA平台后的性能，对不同的精度对系统性能的影响做了讨论，也统计了不同信噪比、多址干扰下的误码率性能。最后一章是对全文的总结和对未来的展望。

标签： FPGA 模算法

上传时间： 2013-06-23

上传用户：hzy5825468
高吞吐量LDPC码编码构造及其FPGA实现

低密度校验码（LDPC，Low Density Parity Check Code）是一种性能接近香农极限的信道编码，已被广泛地采用到各种无线通信领域标准中，包括我国的数字电视地面传输标准、欧洲第二代卫星数字视频广播标准（DVB-S2，Digital Video Broadcasting-Satellite 2）、IEEE 802.11n、IEEE 802.16e等。它是3G乃至将来4G通信系统中的核心技术之一。当今LDPC码构造的主流方向有两个，分别是结合准循环（QC，Quasi Cyclic）移位结构的单次扩展构造和类似重复累积（RA，Repeat Accumulate）码构造。相应地，主要的LDPC码编码算法有基于生成矩阵的算法和基于迭代译码的算法。基于生成矩阵的编码算法吞吐量高，但是需要较多的寄存器和ROM资源；基于迭代译码的编码算法实现简单，但是吞吐量不高，且不容易构造高性能的好码。本文在研究了上述几种码构造和编码算法之后，结合编译码器综合实现的复杂度考虑，提出了一种切实可行的基于二次扩展（Dex，Duplex Expansion）的QC-LDPC码构造方法，以实现高吞吐量的LDPC码收发端；并且充分利用该类码校验矩阵准循环移位结构的特点，结合RU算法，提出了一种新编码器的设计方案。基于二次扩展的QC-LDPC码构造方法，是通过对母矩阵先后进行乱序扩展（Pex，Permutation Expansion）和循环移位扩展（CSEx，Cyclic Shift Expansion）实现的。在此基础上，为了实现可变码长、可变码率，一般编译码器需同时支持多个乱序扩展和循环移位扩展的扩展因子。本文所述二次扩展构造方法的特点在于，固定循环移位扩展的扩展因子大小不变，支持多个乱序扩展的扩展因子，使得译码器结构得以精简；构造得到的码字具有近似规则码的结构，便于硬件实现；（伪）随机生成的循环移位系数能够提高码字的误码性能，是对硬件实现和误码性能的一种折中。新编码器在很大程度上考虑了资源的复用，使得实现复杂度近似与码长成正比。考虑到吞吐量的要求，新编码器结构完全抛弃了RU算法中串行的前向替换（FS，Forward Substitution）模块，同时简化了流水线结构，由原先RU算法的6级降低为4级；为了缩短编码延时，设计时安排每一级流水线计算所需的时钟数大致相同。这种码字构造和编码联合设计方案具有以下优势：相比RU算法，新方案对可变码长、可变码率的支持更灵活，吞吐量也更大；相比基于生成矩阵的编码算法，新方案节省了50％以上的寄存器和ROM资源，单位资源下的吞吐量更大；相比类似重复累积码结构的基于迭代译码的编码算法，新方案使高性能LDPC码的构造更为方便。以上结果都在Xilinx Virtex II pro 70 FPGA上得到验证。通过在实验板上实测表明，上述基于二次扩展的QC-LDPC码构造和相应的编码方案能够实现高吞吐量LDPC码收发端，在实际应用中具有很高的价值。目前，LDPC码正向着非规则、自适应、信源信道及调制联合编码方向发展。跨层联合编码的构造方法，及其对应的编码算法，也必将成为信道编码理论未来的研究重点。

标签： LDPC FPGA 吞吐量编码

上传时间： 2013-07-26

上传用户：qoovoop
动态可重构FPGA的布局布线算法研究

可编程逻辑芯片特别是现场可编程门阵列(Field-Programmable Gate Array，FPGA)芯片的快速发展，使得新的芯片能够根据具体应用动态地调整结构以获得更好的性能，这类芯片称为动态可重构FPGA芯片(Dynamically ReconfigurableFPGA，DRFPGA)。然而，使用这类芯片构建的可重构系统在实际应用前还有许多问题需要解决。一个基本的问题就是动态可重构FPGA芯片中的可重构功能单元(Reconfigurable Functional Unit，RFU)的模块布局问题和模块间的布线问题。本文从基本的FPGA芯片结构和CAD算法谈起，介绍了可重构计算的概念，建立了可重构计算系统模型和动态可重构FPGA芯片模型，在此模型上提出一个基于划分和时延驱动的在线布局算法，和一个基于Pathfinder协商拥塞算法的布线算法，来解决动态可重构FPGA芯片的布局和布线问题。由硬件描述语言(Hardware Description Language，HDL)描述的电路首先被划分成有限数目的层，然后将这些电路层布局到芯片的每一层，同时确保关键路径的时延最小。实验结果表明，布局算法与传统的布局算法(或者文献[37]中的算法)相比，在时延上平均减少27％，在线长上平均减少34％(或者11％)，在运行时间上平均减少42％(或者97％)。布线算法与传统的布线算法相比，能够将线长降低26％，将水平通道宽度降低27％，显示出较高的性能。

标签： FPGA 动态可重构布局布线算法研究

上传时间： 2013-05-24

上传用户：Neoemily
基于DSPFPGA的H264AVC实时编码器

H.264/AVC是ITU-T和ISO联合推出的新标准，采用了近几年视频编码方面的先进技术，以较高编码效率和网络友好性成为新一代国际视频编码标准。本文以实现D1格式的H.264/AVC实时编码器为目标，作者负责系统架构设计，软硬件划分以及部分模块的硬件算法设计与实现。通过对H.264/AVC编码器中主要模块的算法复杂度的评估，算法特点的分析，同时考虑到编码器系统的可伸缩性，可扩展性，本文采用了DSP+FPGA的系统架构。DSP充当核心处理器，而FPGA作为协处理器，针对编码器中最复杂耗时的模块一运动估计模块，设计相应的硬件加速引擎，以提供编码器所需要的实时性能。 H.264/AVC仍基于以前视频编码标准的运动补偿混合编码方案，其中一个主要的不同在于帧间预测采用了可变块尺寸的运动估计，同时运动向量精度提高到1/4像素。更小和更多形状的块分割模式的采用，以及更加精确的亚像素位置的预测，可以改善运动补偿精度，提高图像质量和编码效率，但同时也大大增加了编码器的复杂度，因此需要设计专门的硬件加速引擎。本文给出了1/4像素精度的运动估计基于FPGA的硬件算法设计与实现，包括整像素搜索，像素插值，亚像素(1/2，1/4)搜索以及多模式选择(支持全部七种块分割模式)。设计中，将多处理器技术和流水线技术相结合，提供高性能的并行计算能力，同时，采用合理的存储器组织结构以提供高数据吞吐量，满足运算的带宽要求，并使编码器具有较好的可伸缩性。最后，在Modelsim环境下建立测试平台，完成了对整个设计的RTL级的仿真验证，并针对Altera公司的FPGA芯片stratixⅡ系列的EP2S60-4器件进行优化，从而使工作频率最终达到134MHz，分析数据表明该模块能够满足编码器的实时性要求。

标签： DSPFPGA H264 264 AVC

上传时间： 2013-07-24

上传用户：sn2080395
基于DSP和FPGA的CDMA多用户检测技术

随着社会的进步及移动用户的迅猛增长，第三代移动通信越来越受到各界的重视。多用户检测技术是第三代移动通信中重要的技术之一；常规CDMA接收机采用匹配滤波器的结构，但是这种结构的接收机并没有考虑到信道中多址干扰的存在，使彼此间影响减少来提高系统容量；而功控的方法也没有从接收信号中真正去除多址干扰，只能缓解这种矛盾，不能从根本上解决问题。要想真正消除干扰，大幅度提高系统容量，必须通过多址对消和多用户检测技术。本文首先介绍了CDMA的基本原理和多用户检测的基本原理。然后重点介绍和分析各种多用户检测的原理，然后依据多用户检测的四个技术指标对各种多用户检测的方法进行比较，从中选择实现简单，性能优越的解相关检测器来作为实现的标的算法。然后，本文重点研究分析解相关检测器的原理，给出了实现解相关检测器的系统设计的流程，其中包括硬件电路的搭建和软件实现的方法。硬件电路是基于DSP(TI公司的TMS320C5402)和FPGA(Altera公司的EP1K10Q208-3)来完成。软件部分主要采用C语言来完成。本文系统研究了多用户检测技术，并实现了解相关算法，在理论研究和实际应用方面都有一定的价值。

标签： CDMA FPGA DSP 多用

上传时间： 2013-07-29

上传用户：anpa