VLIW
共 29 篇文章
VLIW 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 29 篇文章,持续更新中。
Power Estimation and Optimization Methodologies for VLIW-Based Embedded Systems.pdf
资料->【E】光盘论文->【E5】英文书籍->Power Estimation and Optimization Methodologies for VLIW-Based Embedded Systems.pdf
双馈感应式风力发电机并网研究
· 摘要: 数字信号处理常常包含大量数据运算,这使得数据Cache成为影响其性能的关键因素.特别是对于我们研制的双簇VLIW结构YHFT DSP系列处理器,Cache的失效会导致整个内核八条流水线同时停顿.所以,减小Cache失效延迟能给处理器性能带来显著的提升.本文研究的主要问题是如何针对一级数据Cache的读失效操作进行优化,从四个方面进行,分别为提前发读请求、请求字优先
奇异数据类型的编译支持
· 摘要: 专用处理器,如DSP等,因主要支持特定应用,其指令集往往只支持有限的数据类型.在采用高级语言为其编程时,若采用了处理器不支持的奇异数据类型,编译器必须在保持语义的前提下将其转化为处理器支持的一段指令.该文提出了一种在VLIW DSP编译器中实现对奇异数据类型的处理的方法,包括对含有奇异数据类型的中间代码的注释、调度依赖关系的计算、寄存器分配的改进.该类方法对编译器
一种支持DSP条件执行指令的编译框架
· 摘要: 为克服条件跳转指令的缺陷,新一代超长指令字(VLIW)体系结构的数字信号处理器(DSP)提供了对条件执行指令的支持.为使得此类指令的优势得以充分发挥,该文设计并实现了一种基于hyperblock区域结构的编译框架.实验结果表明,该框架很好地提高了指令级并行度(ILP),减少了指令执行时间.
面向指令Cache周期预取的代码排布方法
·摘要: 在含Cache的处理器中,代码排布和指令预取是减少取指延迟的常用技术.代码排布侧重研究代码执行的空间相对位置,指令预取则关注于代码执行的时间相对关系.片上Trace技术非入侵地获得程序的执行路径及时间信息,将代码执行的时空关系联系起来,因此为排布技术和预取技术的结合使用提供了基础.基于YHFT-DSP平台,利用程序运行的周期行为特性设置预取,利用VLIW结构处理器的空闲单元执
一种支持同时多线程的VLIW_DSP架构
·一种支持同时多线程的VLIW_DSP架构
基于通用DSP的多模式视频编码器
· 摘要: 采用通用高速DSP设计了一种先进而又适用面广的视频编码器,该编码器不仅可适应不同信道、可压缩多种不同大小的灰度/彩色图像、环境适应能力强,而且灵活性高、可扩展性好,易于形成性能不同、压缩算法不同的系列化产品.为了提高编码器整体性能,由FPGA完成压缩的一些预处理工作.针对TMS320C6000 DSP的VLIW体系结构和存储资源限制以及MPEG压缩算法要求,从软件
一种面向VLIW芯片的线性指令调度算法
· 摘要: VLIW是DSP芯片上使用最多的一种技术,要发挥DSP芯片的性能优势,需要编译器的支持.目前关于VLLW技术的研究主要集中在如何形成更长的基本块,以及基本块之间的代码优化算法上,对于如何选择指令从而形成一个超长指令字的算法,却没有仔细地描述和实现,但这是在编译器的指令调度模块中需要具体考虑的问题,具有工程实践意义.本文通过改进编译器的lisf算法实现了支持VLIW
面向VLIW_DSP结构的编译器的设计与实现
· 摘要: VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大.本文基于一款VLIW DSP芯片,利用可重定位编译器IMPACT的前端和代码生成器模板,设计和实现了高性能的VLIW编译器.利用伪数据类型和Intrinsic函数结合,在编译器中构建了对SIMD功能的支持.实验结果显示,对比基于GCC版本的编译器,该编译器生成的指令数平均
分簇VLIW_DSP调度技术
·摘要: 分簇VLIW DSP在减少硬件设计复杂性的同时,显著地增加了编译器进行指令调度的难度.提出通过在调度中首先进行指令簇划分然后再簇内调度,这样在增加很少几条拷贝指令的条件下充分利用分簇的特性提高指令的并行度,减小调度时间.
基于VLIW的汇编级FDCT和扫描量化优化算法
·摘要: 在视频处理领域以及MEPG2/4相关领域中FDCT以及扫描量化操作的执行效率已经成为大家共同关注的问题,算法优化日益成为热点.文章首先对两个经典的FDCT和扫描量化算法进行了分析,指出了算法的不足之处并给出了解决办法,以TM1300为例介绍了VLIW结构的特性,研究了基于DSP芯片的优化方法,并应用这些方法对MPEG4的FDCT、量化和扫描进行了汇编级的量化优化,最后利用仿真
超长指令字DSP上的数字图像处理算法优化方法
· 摘要: 数字图像处理(Digital Image Processing)广泛应用于航空航天、生物医学工程、通信工程、工业和工程、军事公安、文化艺术等方面.由于一些应用的实时性和环境要求,通常采用数字信号处理器(Digital Signal Processing,简称DSP)处理图像.采用超长指令字(Very Long Instruction Word,简称VLIW)体系结
一种低速可编程的声码器设计与实现
· 摘要: 为增强数字语音通信的安全性,提高传输带宽的利用率,基于低速率SELP算法,设计了一种具有可编程、高并行度、可重构、安全性等特点的声码器.采用四级ALU单元、可变长VLIW专用指令集等设计,优化了复杂度高的功能模块,显著提高指令级并行度.仿真结果表明,该声码器在20MHz主频下完成0.6kbps的SELP算法的平均功耗为200mW,完成编解码的运算复杂度为12.5M
一种支持VLIW_DSP条件跳转指令的技术研究
· 摘要: 条件跳转指令是VLIW DSP中频繁使用的一种指令,循环是条件跳转指令应用的主要领域之一.条件跳转指令高效的设计是VLIW DSP高效运行的关键.针对这类指令实现的复杂性,讨论了一种新的结构Hyperblock,并用这种结构设计实现了BWDSP100处理器中的条件跳转指令,实验证明该方法对于DSP核心算法程序以及实际应用程序都可以获得较好的优化效果,提高了指令并行
整数变换在VLIW_DSP上的优化与仿真
·摘要: 支持超长指令字(Very Long Instruction Word,VLIW)DSP的应用越来越广泛,而H.264视频压缩算法在向此类DSP平台上移植时,由于程序结构设计不合理、数据结构冗余等原因,导致缓存命中率下降,DSP的利用率降低.因此研究最新的视频压缩算法H.264/AVC在此类DSP上的优化就显得越发重要.文中介绍了VLIW DSP的体系结构特点,并研究分析了基于
提升小波变换的三种算法性能比较
· 摘要: 离散小波变换(DWT)在语音,图像等信号处理中有着广泛的应用,在JPEG2000标准中就推荐采用5/3和9/7小波来分别进行无损和有损图像压缩,取代基于DCT变换的图像压缩,并且还推荐采用提升方法来实现.提出三种基于提升方法的二维离散小波变换的并行算法,并在超常超标量数字指令(VLIW)的数字信号处理器(DSP)上进行了性能方面的比较.这里,我们以在图像压缩中常用
一种基于机器描述的VLIW_DSP编译技术
· 摘要: VLIW DSP机器由于硬件控制简单,指令的并行性完全在编译时决定.因此编译程序成为基于VLIW DSP机器应用的关键因素.文章描述通过在编译程序中使用目标机器描述技术,提高了编译程序的可重定目标性,减少了生成目标编译程序的难度.
YHFT-D4汇编器的设计与实现
·摘要: YHFT-D4是一款具有分簇的VLIW体系结构的DSP,它有多个功能单元,可在单个时钟周期并行地执行多条指令.指令执行的功能单元是哪个,哪些指令并行执行,这些由编译器或程序员静态决定,文章给出了YHFT-D4汇编器的设计和实现方法.
VLIW_DSP体系结构及其性能优化的软件方法
· 摘要: 影响DSP系统性能的因素主要有DSP处理器的体系结构、存储器系统、外设接口等硬件技术和程序优化等软件技术,其中软件的优化设计在DSP性能优化中起着越来越重要的作用。文章简要介绍了常见DSP系统的体系结构和存储器组织方法,并通过实例说明了对VLIW DSP系统进行软件优化的几种技术。
基于VLIW_DSP的可重定向编译器设计与实现
·基于VLIW_DSP的可重定向编译器设计与实现