搜索结果
找到约 23 项符合
simd 的查询结果
其他 UCSC Kestrel and Beyond写的一篇关于SIMD的讲义,很好,很使用,也可以作为一个PPT模板使用的经典例子哦
UCSC Kestrel and Beyond写的一篇关于SIMD的讲义,很好,很使用,也可以作为一个PPT模板使用的经典例子哦
Delphi/CppBuilder 利用分治策略,提出一种基于SIMD共享存储计算机模型的并行背包问题求解算法.算法允许使用O(2n/4)1− ε个并行处理机单元,0≤≤ε1,O(2n/2)个存储单元,在O(2n/4(2n/4
利用分治策略,提出一种基于SIMD共享存储计算机模型的并行背包问题求解算法.算法允许使用O(2n/4)1&#8722 ε个并行处理机单元,0≤≤ε1,O(2n/2)个存储单元,在O(2n/4(2n/4)ε)时间内求解n维背包问题,算法的成本为O(2n/2).将提出的算法与已有文献结论进行对比表明,该算法改进了已有文献的相应结果,是求解背包问题的成本最优并行 ...
并行计算 一个简单的基于CUDA的示例代码
一个简单的基于CUDA的示例代码,使用SIMD的方法实现向量加法;运行在nVidia的G80系列显卡的GPGPU上;需要nVidia CUDA SDK,169以上版本的驱动。对于学习CUDA很有帮助。
技术资料 DSP体系结构发展的新趋势
·摘要: CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系结构设计的新趋势.
其他 自20世纪70年代初到现在
自20世纪70年代初到现在,并行计算机的发展已有20多年的历史.在此期间,出现了各种不同类型的并行机,包括历史上曾经风行一时的并行向量机PVP(Parallel Vector Processor)和SIMD 计算机,但它们现在均已衰落了下来
技术资料 基于DSP的三角函数快速计算
· 摘要:  分析了常用三角函数(主要是正余弦)的各种近似计算方法,包括迭代法、级数法、查表法以及CORDIC算法,给出了常用算法的误差特性、误差范围以及时空效率.依据现代DSP的流水、并行( SIMD)和片内存储器等特点,对各种算法进行了优化调整,提高了它们的并行性.综合各种算法优点的实现比一般的库函数快3~5倍而 ...
技术资料 面向VLIW_DSP结构的编译器的设计与实现
· 摘要:  VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大.本文基于一款VLIW DSP芯片,利用可重定位编译器IMPACT的前端和代码生成器模板,设计和实现了高性能的VLIW编译器.利用伪数据类型和Intrinsic函数结合,在编译器中构建了对SIMD功能的支持.实验结果显示,对比基于GCC ...
技术资料 访存带宽最小化的H.264整像素运动估计VLSI结构
·摘 要:面向H.264/AVC整像素运动估计,提出了一种兼顾数据搬运和计算部件效率的全搜索超大规模集成电路(VLSI)结构.通过在片上最大化重用参考像素,使外存访问带宽得到了最小化,每个参考像素只需访存一次.通过分布式内存映射和图像边界的假想连接,使参考像素的搬运过程规则、高效.处理器单元(PE)结构简单,PE阵列以单指令 ...
ARM LPC4300系列ARM双核微控制器产品数据手册
The LPC4350/30/20/10 are ARM Cortex-M4 based microcontrollers for embeddedapplications. The ARM Cortex-M4 is a next generation core that offers systemenhancements such as low power consumption, enhanced debug features, and a highlevel of support block integration.The LPC4350/30/20/10 operate at CPU ...