虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

并行计算

并行计算或称平行计算是相对于串行计算来说的。它是一种一次可执行多个指令的算法,目的是提高计算速度,及通过扩大问题求解规模,解决大型而复杂的计算问题。所谓并行计算可分为时间上的并行和空间上的并行。时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。
  • 通用GPU计算越来越受欢迎了

    通用GPU计算越来越受欢迎了,原因在于GPU具有多个并行计算单元,这是在GPU上进行通用计算的CPP代码

    标签: GPU 计算

    上传时间: 2016-10-10

    上传用户:JIUSHICHEN

  • 并行计算机的出现

    并行计算机的出现,一方面给实时信号处理、大规模科学与工程计算等提供了很好的物质基础与机遇,另一方面又给用户带来 了很多新问题和困难.由于并行机种类繁多、互不通用,如何发挥并行机的效率是用户最关心酌问题.一台性能很高的并行机,如果不能充分发挥其效率,性能会呈数量级下降.因此并行算法的研究是并行计算的一个关键问题.要设计出好的并行算法,必须 对并行计算机的硬件系统、软件系统有足够的了解,让设计的并行算法适合特定的硬件和软件系统.本章对并行计算机的体系结 构、并行编程环境、并行算法的一些基本概念、并行计算的现状及发展趋势等作了介绍.

    标签: 并行计算

    上传时间: 2014-11-28

    上传用户:heart520beat

  • 矩阵并行算法程序

    矩阵并行算法程序,用c#语言编制,可用于数学并行计算

    标签: 矩阵 并行算法 程序

    上传时间: 2014-01-02

    上传用户:CSUSheep

  • Matlab 自2008版本后可以进行并行运算

    Matlab 自2008版本后可以进行并行运算,充分利用CPU资源,这里给出具体进行多核心运算的设置和并行计算工具箱说明

    标签: Matlab 2008 版本 并行运算

    上传时间: 2013-12-19

    上传用户:diets

  • 基于GPUCPU的高性能计算

    资料涉及第一性原理密度泛函理论简介,CPU-MPI和GPU-CUDA异构并行计算和第一性原理功能材料设计和计算模拟

    标签: cpu

    上传时间: 2021-12-17

    上传用户:

  • 计算智能中的仿生学:理论与算法---西安交大

    计算智能是以模型(计算模型、数学模型)为基础、以分布并行计算为特征的模拟人的智能求解问题的理论与方法。本书系统讲述计算智能的某本内容、基本理论与基本方法。全书分三部分。第一章从模拟智能生成过程的观点讲述模拟进化计算理论;第二章从模拟智能结构的观点讲述模拟神经网络理论;第二章从模拟智能行为的观点讲述模糊逻辑与模糊推理。

    标签: 计算智能 仿生学

    上传时间: 2022-07-11

    上传用户:

  • 基于FPGA的数字图像处理的研究.rar

    图像是人类智能活动重要的信息来源之一,是人类相互交流和认识世界的主要媒体。随着信息高速公路、数字地球概念的提出,人们对图像处理技术的需求与日剧增,同时VLSI技术的发展给图像处理技术的应用提供了广阔的平台。图像处理技术是图像识别和分析的基础,所以图像处理技术对整个图像工程来说就非常重要,对图像处理技术的实现的研究也就具有重要的理论意义与实用价值,包括对传统算法的改进和硬件实现的研究。仿生算法的兴起为图像处理问题的解决提供了一条十分有效的新途径;FPGA技术的发展为图像处理的硬件实现提供了有效的平台。 @@ 本文在详细介绍邻域图像处理算法及其数据结构、遗传算法和蚁群算法基本原理的基础上,将其应用于图像增强和图像分割的图像处理问题之中,并将其用FPGA技术实现。论文中采用遗传算法自适应的确定非线性变换函数的参数对图像进行增强,在采用FPGA来实现的过程中先对系统进行模块划分,主要分为初始化模块、选择模块、适应度模块、控制模块等,然后利用VHDL语言描述各个功能模块,为了提高设计效率,利用IP核进行存储器设计,利用DSP Builder进行数学运算处理。时序控制是整个系统设计的核心,为尽量避免毛刺现象,各模块的时序控制都是采用单进程的Moore状态机实现的。在图像分割环节中,图像分割问题转换为求图像的最大熵问题,采用蚁群算法对改进的最大熵确定的适应度函数进行优化,并对基于FPGA和蚁群算法实现图像分割的各个模块设计进行了详细介绍。 @@ 对实验结果进行分析表明遗传算法和蚁群算法在数字图像处理中的使用明显改善了处理的效果,在利用FPGA实现遗传算法和蚁群算法的整个设计过程中由于充分发挥了FPGA的并行计算能力及流水线技术的应用,大大提高算法的运行速度。 @@关键词:图像处理;遗传算法;蚁群算法;FPGA

    标签: FPGA 数字图像处理

    上传时间: 2013-06-03

    上传用户:小火车啦啦啦

  • 基于DSPFPGA的H264AVC实时编码器

    H.264/AVC是ITU-T和ISO联合推出的新标准,采用了近几年视频编码方面的先进技术,以较高编码效率和网络友好性成为新一代国际视频编码标准。 本文以实现D1格式的H.264/AVC实时编码器为目标,作者负责系统架构设计,软硬件划分以及部分模块的硬件算法设计与实现。通过对H.264/AVC编码器中主要模块的算法复杂度的评估,算法特点的分析,同时考虑到编码器系统的可伸缩性,可扩展性,本文采用了DSP+FPGA的系统架构。DSP充当核心处理器,而FPGA作为协处理器,针对编码器中最复杂耗时的模块一运动估计模块,设计相应的硬件加速引擎,以提供编码器所需要的实时性能。 H.264/AVC仍基于以前视频编码标准的运动补偿混合编码方案,其中一个主要的不同在于帧间预测采用了可变块尺寸的运动估计,同时运动向量精度提高到1/4像素。更小和更多形状的块分割模式的采用,以及更加精确的亚像素位置的预测,可以改善运动补偿精度,提高图像质量和编码效率,但同时也大大增加了编码器的复杂度,因此需要设计专门的硬件加速引擎。 本文给出了1/4像素精度的运动估计基于FPGA的硬件算法设计与实现,包括整像素搜索,像素插值,亚像素(1/2,1/4)搜索以及多模式选择(支持全部七种块分割模式)。设计中,将多处理器技术和流水线技术相结合,提供高性能的并行计算能力,同时,采用合理的存储器组织结构以提供高数据吞吐量,满足运算的带宽要求,并使编码器具有较好的可伸缩性。最后,在Modelsim环境下建立测试平台,完成了对整个设计的RTL级的仿真验证,并针对Altera公司的FPGA芯片stratixⅡ系列的EP2S60-4器件进行优化,从而使工作频率最终达到134MHz,分析数据表明该模块能够满足编码器的实时性要求。

    标签: DSPFPGA H264 264 AVC

    上传时间: 2013-07-24

    上传用户:sn2080395

  • 基于FPGA的GPS定位信息处理系统设计

    随着GPS(Global Positioning System)技术的不断发展和成熟,其全球性、全天候、低成本等特点使得GPS接收机的用户数量大幅度增加,应用领域越来越广。但由于定位过程中各种误差源的存在,单机定位精度受到影响。目前常从两个方面考虑减小误差提高精度:①用高精度相位天线、差分技术等通过提高硬件成本获取高精度;②针对误差源用滤波算法从软件方面实现精度提高。两种方法中,后者相对于前者在满足精度要求的前提下节约成本,而且便于系统融合,是应用于GPS定位的系统中更有前景的方法。但由于在系统中实现定位滤波算法需要时间,传统CPU往往不能满足实时性的要求,而FPGA以其快速并行计算越来越受到青睐。    本文在FPGA平台上,根据“先时序后电路”的设计思想,由同步没计方法以及自顶向下和自下而上的混合设计方法实现系统的总体设计。从GPS-OEM板输出的定位信息的接收到定位结果的坐标变换,最终到kalman滤波递推计算减小定位误差,实现实时、快速、高精度的GPS定位信息采集处理系统,为GPS定位数据的处理方法做了新的尝试,为基于FPGA的GPS嵌入式系统的开发奠定了基础。具体工作如下:    基于FPGA设计了GPS定位数据的正确接收和显示,以及经纬度到平面坐标的投影变换。根掘GPS输出信息标准和格式,通过串口接收模块实现串口数掘的接收和经纬度信息提取,并通过LCD实时显示。在提取信息的同时将数据格式由ASCⅡ码转变为十进制整数型,实现利用移位和加法运算达到代替乘法运算的效果,从而减少资源的利用率。在坐标转换过程中,利用查找表的方法查找转化时需要的各个参数值,并将该参数先转为双精度浮点小数,再进行坐标转换。根据高斯转化公式的规律将公式简化成只涉及加法和乘法运算,以此简化公式运算量,达到节省资源的目的。    卡尔曼滤波器的实现。首先分析了影响定位精度的各种误差因素,将各种误差因素视为一阶马尔科夫过程的总误差,建立了系统状态方程、观测方程和滤波方程,并基于分散滤波的思想进行卡尔曼滤波设计,并通过Matlab进行仿真。结果表明,本文设计的卡尔曼滤波器收敛性好,定位精度高、估计误差小。在仿真基础上,实现基于FPGA的卡尔曼滤波计算。在满足实时性的基础上,通过IP核、模块的分时复用和树状结构节省资源,实现数据卡尔曼滤波,达到提高数据精度的效果。    设计中以Xilinx公司的Virtex-5系列的XC5VLX110-FF676为硬件平台,采用Verilog HDL硬件描述语言实现,利用Xilinx公司的ISE10.1工具布局布线,一共使用44438个逻辑资源,时钟频率达到100MHZ以上,满足实时性信号处理要求,在保证精度的前提下达到资源最优。Modelsim仿真验证了该设计的正确性。

    标签: FPGA GPS 定位 信息处理

    上传时间: 2013-04-24

    上传用户:二驱蚊器

  • 基于CUDA的红外图像快速增强算法研究

    针对红外图像边缘模糊,对比度低的问题,文中研究了改进的中值滤波和改进的Sobel边缘检测对红外图像进行处理。在对处理后图像的特征进行分析的基础上,研究了改进的Laplace金字塔分解的图像融合算法,并基于CUDA并行处理技术,在可编程GPU上实现了红外图像快速增强的目的。该算法结合GPU的内存特点,应用纹理映射、多点访问、并行触发技术,优化数据的存储结构,提高数据处理速度,适用于对红外图像增强的实时性要求较高的领域。实验结果表明,该算法有较好的并行特性,能充分利用CUDA的并行计算能力,提高了红外图像增强的实时性,处理分辨率为3 096×3 096的红外图像时加速比达32.189。

    标签: CUDA 红外图像 算法研究

    上传时间: 2014-01-03

    上传用户:mh_zhaohy