并行性

共 125 篇文章
并行性 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 125 篇文章,持续更新中。

DSP论文8-7

H.264在多核平台上的并行性分析。。。。。。。。。。。。

基于微全分析系统中双单片机控制

介绍了一种基于当前多通道的毛细管电泳芯片的发展基础上,双单片机控制和通讯系统的设计与实现.通过串行或并行总线机制来开发系统的并行性,提高了对当前高数据量芯片的处理和实时通讯的速度,简化电路设计,可独立灵活地控制分离和进样时间,电压等条件.有利于实现微全分析系统的高效化、集成化,易控制,降低干扰,适合野外数据采集和检测.

基于Omap5910嵌入式平台的并行JPEG压缩算法

· 摘要:  针对传统离散余弦变换的行列法中存在的并行性,提出了一个基于Omap5910平台的并行JPEG压缩算法.该算法利用JPEG图像压缩过程中的数据无关性将任务分配到Omap5910平台的两个处理器(ARM和DSP)上,并以多线程模拟多处理器对JPEG压缩过程中的关键步骤离散余弦变换进行并行处理.实验结果表明,该算法在保证与串行压缩算法具有相同的压缩质量的前提下,能够有效

基于DSP的H.264_AVC滤波器优化设计

·摘要:  在H.264/AVC视频标准中,自适应环路滤波器用于消除预测和变换过程中引入的块效应,提高编码性能,但它具有较高的复杂性,占据大量的运算时间.针对这一问题,设计和实现一种基于数字信号处理DSP平台的流水线设计方法,采用条件判断减少跳转,利用并行性加速运算.实验数据表明,该方法能提高环路滤波器的效率.  

支持细粒度并行性开发的多核DSP快速核间通信机制

·摘要:  一些数字信号处理程序存在强数据相关性,在将这些数字信号处理程序划分到多核DSP上时,需要开发细粒度并行性,而细粒度并行性的开发需要快速的核间通信机制支持.本文提出了一种新的面向多核DSP的快速核间通信机制:标记式共享寄存器文件TSRF,TSRF由所有的DSP核共享,寄存器文件中的每个寄存器同一个有效标记位关联,该标记位提供了核间通信同步支持.本文构建了集成TSRF机制的多核D

基于DSP的三角函数快速计算

· 摘要:  分析了常用三角函数(主要是正余弦)的各种近似计算方法,包括迭代法、级数法、查表法以及CORDIC算法,给出了常用算法的误差特性、误差范围以及时空效率.依据现代DSP的流水、并行( SIMD)和片内存储器等特点,对各种算法进行了优化调整,提高了它们的并行性.综合各种算法优点的实现比一般的库函数快3~5倍而且相对精度很高.  

面向VLIW_DSP结构的编译器的设计与实现

· 摘要:  VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大.本文基于一款VLIW DSP芯片,利用可重定位编译器IMPACT的前端和代码生成器模板,设计和实现了高性能的VLIW编译器.利用伪数据类型和Intrinsic函数结合,在编译器中构建了对SIMD功能的支持.实验结果显示,对比基于GCC版本的编译器,该编译器生成的指令数平均

并行实现WLFM信号空间谱估计

· 摘要:  针对宽带线型调频(WLFM)信号空间谱估计(special spectrum estimation)运算量大的弊端,研究了模糊函数域-空域处理算法的实时实现.在分析了算法内在并行性的基础上,提出了一种任务级的并行处理算法.给出了该算法在多数字信号处理器(DSP)并行处理系统上的算法映射.数据实验结果表明,基于多DSP并行处理系统的模糊函数域-空域并行算法具有较高的

一种支持VLIW_DSP条件跳转指令的技术研究

· 摘要:  条件跳转指令是VLIW DSP中频繁使用的一种指令,循环是条件跳转指令应用的主要领域之一.条件跳转指令高效的设计是VLIW DSP高效运行的关键.针对这类指令实现的复杂性,讨论了一种新的结构Hyperblock,并用这种结构设计实现了BWDSP100处理器中的条件跳转指令,实验证明该方法对于DSP核心算法程序以及实际应用程序都可以获得较好的优化效果,提高了指令并行

无限冲激响应滤波器的设计与实现

· 摘要:  现场可编程门阵列(FPGA)器件以其灵活的可配置特性,可以很好地解决并行性和速度问题在数字信号领域得到广泛地应用,但要求使用VHDL或VerilogHDL语言进行设计的难度较大.本文提出了一种采用FPGA实现无限冲激响应滤波器的设计方案.并以一个四阶低通ⅡR数字滤波器的实现为例,设计并完成软硬件仿真与验证.结果表明,方法简单易行,能满足设计要求. &nb

一种基于任务的机器人全局并行算法研究及实现

·摘要:  本文提出了一种基于任务的机器人全局并行算法,结合主从结构的MIMD并行处理平台将机器人控制中的运动学、动力学、控制律等基本计算任务分别进行任务划分,将划分好的子任务统一用工作池方式实现全局的动态调度.采用流水线及集中式动态调度策略,在一个由5个DSP处理器组成的同构型松耦合MIMD并行处理平台上对平面机器人进行了并行实时仿真实验,取得了满意的并行性能指标. &nbs

一种基于机器描述的VLIW_DSP编译技术

· 摘要:  VLIW DSP机器由于硬件控制简单,指令的并行性完全在编译时决定.因此编译程序成为基于VLIW DSP机器应用的关键因素.文章描述通过在编译程序中使用目标机器描述技术,提高了编译程序的可重定目标性,减少了生成目标编译程序的难度.  

DSP体系结构发展的新趋势

·摘要:  CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系结构设计的新趋势. 

基于VCP的DSP维特比译码器的设计与实现

· 摘要:  介绍了TI的TMS320C6416 DSP片上Viterbi译码协处理器(VCP)的结构与原理.给出了一种使用链式EDMA结构和乒乓缓冲技术提高VCP译码过程并行性的方法.设计出基于MATLAB的Link for CCS模块的MATLAB-DSP联合仿真平台.对VCP性能进行测试.实验结果表明,VCP提高了系统误码性能,在译码速度上优于软件译码. &nb

基于并行小波算法的DEM数据多分辨率模型构建

·摘要:  由于离散小波的多分辨率分析特性和DEM数据多分辨率模型的一致性,可以采用离散小波算法来构建DEM多分辨率模型,同时针对现有的基于小波的DEM数据多分辨率模型构建中运算量过大的问题,采用了基于并行的小波算法来进行多分辨率模型构建.由于DEM数据等价于二维的灰度图像,可以作为二维信号来进行处理.首先给出了二维离散信号小波变换的Mallat算法,进行了算法的可并行性分析;然后描述了

AVS变换算法在C64x+DSP上的实现

·摘要:  讨论了音视频编码标准AVS中比较耗时的部分--8x8 IDCT变换的一维快速算法,提出了变换算法在TI公司的TMS320DM6446芯片的C64x+DSP子系统上的快速实现方法.该方法针对视频编码的实时性要求,根据C64x+DSP的特点和存储器结构特性,利用线性汇编优化,提高了代码的并行性和存储器访问效率.DSP仿真结果表明,文中提出的快速实现方法可以提高性能4倍以上.&nb

一种基于寄存器压力的VLIW DSP分簇算法

·摘要:  寄存器是程序运行时最宝贵的资源之一,软件流水在对VLIW DSP指令调度的同时,会显著增加寄存器的压力,从而导致寄存器溢出,软件流水中止.在以往的研究中,软件流水之前的指令分簇会更多地考虑指令并行性,往往会把寄存器的压力交给寄存器分配阶段,当物理寄存器不够分配时会造成寄存器溢出.通过考察指令运行时的寄存器压力情况对指令进行分簇,这样可根据各个簇的寄存器压力的动态信息减少寄存器

基于DSP的视频采集系统设计

· 摘要:  为了解决基于DSP视频监控系统的数据采集问题,本系统采用了视频专用解码A/D芯片和复杂可编程逻辑器件CPLD进行控制和接口设计,有效地实现视频信号的采集与读取的高速并行性,提高了电路的可靠性高,简化了电路设计过程,使整个系统的设计增加柔韧性. 

基于FPGA的分子动力学计算系统

近年来,分子动力学的模拟仿真在生物分子、材料科学、物理科学等方向应用越来越广泛。使用FPGA加速分子动力学模拟的研究也逐渐成为高性能研究领域的热门话题之一,主要原因在于FPGA同时综合了ASIC和通用处理器的优点。针对分子动力学计算的特点,本文提出一个基于FPGA的分子动力学并行计算系统。    在分子动力学模拟仿真模拟中,其分子间作用力的计算是整个过程中耗时最长的部分,根据分子间间距的长短可将

一种软件流水的反流水算法

· 摘要:  软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIW DSP处理机的指令级并行性,必须使用软件流水技术对DSP程序进行优化.然而,在串行源代码不存在的情况下,对软件流水后的原始代码进行变换、理解、测试和调试,并转换成其他处理机的代码是非常困难的.提出了一种反流水技术,它能够将软件流水后的优化汇编代码反向转换成语义等价的相应代码.通