simd

共 23 篇文章
simd 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 23 篇文章,持续更新中。

TI--M4中的SIMD讲解

TI--M4中的SIMD讲解,不错的资料,值得学习。

FPGA论文54

适用于SIMD体系结构的FPGA分页仿真模型研究。。。。。。。。。。。

提升小波变换的SIMD_PE阵列实现

·摘 要:对面向G级像素帧处理的高效实现,提出一种基于SIMD PE阵列的Daubechies 9-7提升小波变换的数据并行实现方案.针对提升小波变换的不同提升阶段,采用阶段内并行、阶段间串行的处理方式,避免了阶段内处理中的数据相关,大幅度地提高了处理的速度.为减少多层分解变换中PE间通信开销,采用行、列动态PM2I网互联结构,实现了不同分解层次中相关PE间的直接互联,降低了各层变换中PE间的通信

基于DSP的三角函数快速计算

· 摘要:  分析了常用三角函数(主要是正余弦)的各种近似计算方法,包括迭代法、级数法、查表法以及CORDIC算法,给出了常用算法的误差特性、误差范围以及时空效率.依据现代DSP的流水、并行( SIMD)和片内存储器等特点,对各种算法进行了优化调整,提高了它们的并行性.综合各种算法优点的实现比一般的库函数快3~5倍而且相对精度很高.  

面向VLIW_DSP结构的编译器的设计与实现

· 摘要:  VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大.本文基于一款VLIW DSP芯片,利用可重定位编译器IMPACT的前端和代码生成器模板,设计和实现了高性能的VLIW编译器.利用伪数据类型和Intrinsic函数结合,在编译器中构建了对SIMD功能的支持.实验结果显示,对比基于GCC版本的编译器,该编译器生成的指令数平均

一种支持SIMD指令的表驱动的代码选择技术

·摘要:  代码选择在编译器的代码产生阶段是一个十分重要的任务,它的目标就是在与机器无关的中间表示代码和与处理器相关的机器指令之间寻找一种高效的映射方法.为了支持DSP处理器的SIMD指令,在传统的基于数据流树中间表示的代码选择算法的基础上,提出一种基于数据流图(DFG)的代码选择技术,它能在最大限度地挖掘和利用SIMD指令的基础上寻求对整个DFG的最优覆盖.  

一种支持SIMD指令的低功耗分裂式ALU设计

· 摘要:  在面向多媒体运算的高性能、低功耗DSP芯片MD32设计中,支持SIMD指令的分裂式、低功耗ALU设计是实现其设计目标的重要环节.该文提出了利用基于资源共享的设计思想,以超前进位加法器(Carry Look-ahead Adder)为核心构造数据处理单元,完成算术以及逻辑运算,减少了ALU模块的面积,同时均衡了不同数据通路长度,并且采用先进行数据选择,而后进行数据处

嵌入式SIMD处理器上G.729的优化方法研究

·嵌入式SIMD处理器上G.729的优化方法研究

DSP体系结构发展的新趋势

·摘要:  CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系结构设计的新趋势. 

访存带宽最小化的H.264整像素运动估计VLSI结构

·摘 要:面向H.264/AVC整像素运动估计,提出了一种兼顾数据搬运和计算部件效率的全搜索超大规模集成电路(VLSI)结构.通过在片上最大化重用参考像素,使外存访问带宽得到了最小化,每个参考像素只需访存一次.通过分布式内存映射和图像边界的假想连接,使参考像素的搬运过程规则、高效.处理器单元(PE)结构简单,PE阵列以单指令多数据流(SIMD)方式工作,数据通信采用脉动方式,计算部件的利用效率为1

SIMD计算机的优化编译器设计

利用处理器的相关资源,提高编译器优化性能和增强代码可适应性是SIMD处理器优化编译的关键。该文基于M语言和LS SIMD体系结构,结合现代编译器的编译技术,提出针对SIMD协处理器编译器的优化和实现方

基于ARM多核平台的打印机JPEG高速解码引擎设计与实现

大多数现在的PCL打印机驱动程序都是将需要打印的文件(包括图形或者文本)处理成JPEG文件发送到打印机进行打印,因为这样一方面可以减少发送给打印机的数据量,一方面可以极大的简化驱动程序的开发。而在打印机内部,这些JPEG文件又被解码成BMP文件进行进一步的处理。采用这种方式工作的打印机JPEG解码的工作占据了其CPU时间的一半以上,所以JPEG文件解码引擎是打印机的核心之一,提高JPEG的解码速度

FlexiGAN:用于FPGA加速生成性对抗网络的端到端解决方案

<p>生成性对抗网络(GAN)是一种深度学习的前沿。 GAN包括两个模型:生成和歧视。虽然辨别模型使用传统的卷积,生成模型依赖于一个根本不同的运算符,称为转置卷积。此运算符最初会插入大量的零它的输入然后在这个扩展的输入上滑动一个窗口。这种零插入步骤导致大量无效作并创建不同的计算模式穿过推拉窗。无效的操作随着计算模式的变化导致显着使用传统卷积时资源利用不足硬件。为了缓解这些低效率的来源,本文设计Fl

MIPS32 SIMD指令架构

<p>MIPS32 SIMD指令架构&nbsp;官方指南&nbsp; 学习君正xburst&nbsp;必备</p>

UCSC Kestrel and Beyond写的一篇关于SIMD的讲义,很好,很使用,也可以作为一个PPT模板使用的经典例子哦

UCSC Kestrel and Beyond写的一篇关于SIMD的讲义,很好,很使用,也可以作为一个PPT模板使用的经典例子哦

SIMD 并行计算资料

用于实行SIMD 算法的核心手册 &nbsp;在intel x 86 , powerpc , mips, arm 处理器上都有相关应用,用于处理向量,加速算法,图像图像处理,模式识别,数字信号处理等领域&nbsp;

自20世纪70年代初到现在

自20世纪70年代初到现在,并行计算机的发展已有20多年的历史.在此期间,出现了各种不同类型的并行机,包括历史上曾经风行一时的并行向量机PVP(Parallel Vector Processor)和SIMD 计算机,但它们现在均已衰落了下来

检查当前处理器可用的SIMD指令的类型

检查当前处理器可用的SIMD指令的类型,希望对各位有用

利用分治策略,提出一种基于SIMD共享存储计算机模型的并行背包问题求解算法.算法允许使用O(2n/4)1&#8722 ε个并行处理机单元,0≤≤ε1,O(2n/2)个存储单元,在O(2n/4(2n/4

利用分治策略,提出一种基于SIMD共享存储计算机模型的并行背包问题求解算法.算法允许使用O(2n/4)1&#8722 ε个并行处理机单元,0≤≤ε1,O(2n/2)个存储单元,在O(2n/4(2n/4)ε)时间内求解n维背包问题,算法的成本为O(2n/2).将提出的算法与已有文献结论进行对比表明,该算法改进了已有文献的相应结果,是求解背包问题的成本最优并行算法.同时还指出了相关文献主要结论的错误.

SIMD_FIRs信号处理

SIMD_FIRs信号处理,采用切比雪夫滤波器,3阶,在DSP21161平台开发,