利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前的CPU.格子玻尔兹曼方法(lattice Boltzmann method,LBM)作为一种网格上的粒子方法,对流动模拟具有良好的内在并行性,非常适合利用GPU进行大规模并行计算.本文提出了一种耦合Nvidia和AMD的两类GPU完成LBM凹槽流模拟的算法,对于两类GPU,在LBM的D2Q9模型下分别设计了相应的算法和程序,之后利用消息传递接口(message passing interface,MPI)协议通过多程序多数据流(multi-progra mmulti-data,MPMD)模式使其能够联合计算,以充分发挥混合GPU集群系统的性能.通过GPU和CPU程序结果的比较,证实了GPU计算的正确性和所能带来的显著的加速比,为建设通用大规模GPU并行计算平台提供了重要参考
この論文では,ビデオ映像に含まれる振動成分を取り除くための処理の計算をGPU を用いて行う手法を提案する.映像の安定化処理には,グローバルモーションの推定,振動補正,モザイキングの3 つの処理を行うが...
体素化是面图形学通向体图形学的桥梁,具有广泛且重要的应用.介绍体素化方面的研究进展,分析现有体素化方法在处理高分辨率实体体素化时的不足.提出以分块为基础的高分辨率实体体素化算法:在分块内部,采用基于图...
基于交错网格的SIMPLE算法,利用CUDA(compute unified device architecture)技术进行了图形处理器(GPU)上的直接数值模拟(DNS).将高雷诺数方腔流作为研究...
利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前...
近年来,GPU在通用计算方面对传统的CPU应用发起了强有力的冲击,被广泛运用于各种高性能计算中,特别是网络安全领域。为了解决传统硬件加速存在的缺陷问题,首先介绍GPU的基本硬件架构及其并行计算原理,其...
本文采用格子Boltzmann方法(LBM)在图形处理器(GPU)上计算了由静止圆柱阵列组成的团聚物周期单元内的不可压缩流体流动,流固交界面处采用直接反弹以实现无滑移边界,每个圆柱上的曳力通过统计动量...
图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用.提出了一个基于GPU片元程序计算B样条曲面的加速算法.通过测试算法在GPU上计算B样条曲面的时间与基于...
卒業論文text画像認識に用いられる一般化ハフ変換は,ノイズや重なり,隠れに強いが処理速度が遅いとされているアルゴリズムである。この一般化ハフ変換の高速化を目的として,GPU (Graphics Pr...
PCのグラフィックボード(GPU)の果たす役割は年々加速しており,CPU中心の計算環境からGPU中心の計算環境へと徐々に移行している.また,GPUの持つ機能をプログラムで利用できる環境が整ったことによ...
近年来GPU作为一种具有极强运算能力的多核处理器,得到了快速的发展,成为高性能计算领域的主要发展方向。各种分子动力学模拟的主流软件也纷纷使用GPU技术,其中LAMMPS较早地开发出了通用的并行GPU版...
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计...
粒子模拟是研究离散粒子和连续介质运动规律的常用方法。而大规模的粒子模拟通常借助高性能计算系统。近年来,得益于其众核架构,图形处理器(GPU)已成为高性能计算的重要设备,并被广泛用于大规模粒子模拟过程的...
背景:抗葡萄糖6磷酸异构酶(GPI)抗体在K/Bx N小鼠模型中起到致关节炎作用,大部分类风湿关节炎( RA)患者血清中存在高浓度的抗GPI抗体。目的:探讨血清GPI水平在 RA筛查诊断中的意义,以及...
本文首先对格子玻尔兹曼方法(Lattice Boltzmann Method.LBM)做详细介绍,通过对该方法起源、发展、宏观表现、模型及参数、初始条件以及边条件处理方法等方面的讨论,建立关于LBM的...
CT图像重建具有高计算密集性、高并行性、大数据量的特点,特别适用于单指令多线程并行操作的流处理架构,图形处理单元正是基于这样架构的一种硬件。本文基于消息传递接口与CUDA混合编程,实现了多个图形处理单...
この論文では,ビデオ映像に含まれる振動成分を取り除くための処理の計算をGPU を用いて行う手法を提案する.映像の安定化処理には,グローバルモーションの推定,振動補正,モザイキングの3 つの処理を行うが...
体素化是面图形学通向体图形学的桥梁,具有广泛且重要的应用.介绍体素化方面的研究进展,分析现有体素化方法在处理高分辨率实体体素化时的不足.提出以分块为基础的高分辨率实体体素化算法:在分块内部,采用基于图...
基于交错网格的SIMPLE算法,利用CUDA(compute unified device architecture)技术进行了图形处理器(GPU)上的直接数值模拟(DNS).将高雷诺数方腔流作为研究...
利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前...
近年来,GPU在通用计算方面对传统的CPU应用发起了强有力的冲击,被广泛运用于各种高性能计算中,特别是网络安全领域。为了解决传统硬件加速存在的缺陷问题,首先介绍GPU的基本硬件架构及其并行计算原理,其...
本文采用格子Boltzmann方法(LBM)在图形处理器(GPU)上计算了由静止圆柱阵列组成的团聚物周期单元内的不可压缩流体流动,流固交界面处采用直接反弹以实现无滑移边界,每个圆柱上的曳力通过统计动量...
图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用.提出了一个基于GPU片元程序计算B样条曲面的加速算法.通过测试算法在GPU上计算B样条曲面的时间与基于...
卒業論文text画像認識に用いられる一般化ハフ変換は,ノイズや重なり,隠れに強いが処理速度が遅いとされているアルゴリズムである。この一般化ハフ変換の高速化を目的として,GPU (Graphics Pr...
PCのグラフィックボード(GPU)の果たす役割は年々加速しており,CPU中心の計算環境からGPU中心の計算環境へと徐々に移行している.また,GPUの持つ機能をプログラムで利用できる環境が整ったことによ...
近年来GPU作为一种具有极强运算能力的多核处理器,得到了快速的发展,成为高性能计算领域的主要发展方向。各种分子动力学模拟的主流软件也纷纷使用GPU技术,其中LAMMPS较早地开发出了通用的并行GPU版...
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计...
粒子模拟是研究离散粒子和连续介质运动规律的常用方法。而大规模的粒子模拟通常借助高性能计算系统。近年来,得益于其众核架构,图形处理器(GPU)已成为高性能计算的重要设备,并被广泛用于大规模粒子模拟过程的...
背景:抗葡萄糖6磷酸异构酶(GPI)抗体在K/Bx N小鼠模型中起到致关节炎作用,大部分类风湿关节炎( RA)患者血清中存在高浓度的抗GPI抗体。目的:探讨血清GPI水平在 RA筛查诊断中的意义,以及...
本文首先对格子玻尔兹曼方法(Lattice Boltzmann Method.LBM)做详细介绍,通过对该方法起源、发展、宏观表现、模型及参数、初始条件以及边条件处理方法等方面的讨论,建立关于LBM的...
CT图像重建具有高计算密集性、高并行性、大数据量的特点,特别适用于单指令多线程并行操作的流处理架构,图形处理单元正是基于这样架构的一种硬件。本文基于消息传递接口与CUDA混合编程,实现了多个图形处理单...
この論文では,ビデオ映像に含まれる振動成分を取り除くための処理の計算をGPU を用いて行う手法を提案する.映像の安定化処理には,グローバルモーションの推定,振動補正,モザイキングの3 つの処理を行うが...
体素化是面图形学通向体图形学的桥梁,具有广泛且重要的应用.介绍体素化方面的研究进展,分析现有体素化方法在处理高分辨率实体体素化时的不足.提出以分块为基础的高分辨率实体体素化算法:在分块内部,采用基于图...
基于交错网格的SIMPLE算法,利用CUDA(compute unified device architecture)技术进行了图形处理器(GPU)上的直接数值模拟(DNS).将高雷诺数方腔流作为研究...