利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前的CPU.格子玻尔兹曼方法(lattice Boltzmann method,LBM)作为一种网格上的粒子方法,对流动模拟具有良好的内在并行性,非常适合利用GPU进行大规模并行计算.本文提出了一种耦合Nvidia和AMD的两类GPU完成LBM凹槽流模拟的算法,对于两类GPU,在LBM的D2Q9模型下分别设计了相应的算法和程序,之后利用消息传递接口(message passing interface,MPI)协议通过多程序多数据流(multi-progra mmulti-data,MPMD)模式使其能够联合计算,以充分发挥混合GPU集群系统的性能.通过GPU和CPU程序结果的比较,证实了GPU计算的正确性和所能带来的显著的加速比,为建设通用大规模GPU并行计算平台提供了重要参考
设计了一种基于图形处理器(GPU)的无缝地形渲染方法。该方法基于二叉树构建多层次地形网格,该网格用基于行、列号的地形模板表示。在设计过程中,将高程数据转化为适于GPU读取的高程纹理图,再通过顶点纹理提...
PCのグラフィックボード(GPU)の果たす役割は年々加速しており,CPU中心の計算環境からGPU中心の計算環境へと徐々に移行している.また,GPUの持つ機能をプログラムで利用できる環境が整ったことによ...
在GPU上进行多片元效果的绘制,已有的方法往往需要对模型进行多遍的数据读取,以进行片元的有效排序.由于往GPU传输数据的带宽限制,多遍的数据读取严重制约了绘制效率的提高.虽然,随着CUDA的出现,已有...
利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前...
近年来,GPU在通用计算方面对传统的CPU应用发起了强有力的冲击,被广泛运用于各种高性能计算中,特别是网络安全领域。为了解决传统硬件加速存在的缺陷问题,首先介绍GPU的基本硬件架构及其并行计算原理,其...
GPU通用计算的出现为MD模拟计算性能的提升带来了一场技术革新。本文对支持MD模拟GPU加速的软件的计算性能进行了系统测试。以标准算例DHFR为测试基准,本文比较了三个典型MD软件在单GPU卡上的计算...
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计...
本文采用格子Boltzmann方法(LBM)在图形处理器(GPU)上计算了由静止圆柱阵列组成的团聚物周期单元内的不可压缩流体流动,流固交界面处采用直接反弹以实现无滑移边界,每个圆柱上的曳力通过统计动量...
图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用.提出了一个基于GPU片元程序计算B样条曲面的加速算法.通过测试算法在GPU上计算B样条曲面的时间与基于...
近年来GPU作为一种具有极强运算能力的多核处理器,得到了快速的发展,成为高性能计算领域的主要发展方向。各种分子动力学模拟的主流软件也纷纷使用GPU技术,其中LAMMPS较早地开发出了通用的并行GPU版...
粒子模拟是研究离散粒子和连续介质运动规律的常用方法。而大规模的粒子模拟通常借助高性能计算系统。近年来,得益于其众核架构,图形处理器(GPU)已成为高性能计算的重要设备,并被广泛用于大规模粒子模拟过程的...
卒業論文text画像認識に用いられる一般化ハフ変換は,ノイズや重なり,隠れに強いが処理速度が遅いとされているアルゴリズムである。この一般化ハフ変換の高速化を目的として,GPU (Graphics Pr...
背景:抗葡萄糖6磷酸异构酶(GPI)抗体在K/Bx N小鼠模型中起到致关节炎作用,大部分类风湿关节炎( RA)患者血清中存在高浓度的抗GPI抗体。目的:探讨血清GPI水平在 RA筛查诊断中的意义,以及...
通用目的图形处理器(GPGPU)在高性能计算(HPC)领域正得到越来越多的重视和应用。Mole-8.5作为世界上首套使用NVIDIA Tesla C2050的GPGPU超级计算系统,在颗粒流、多相流等...
この論文では,ビデオ映像に含まれる振動成分を取り除くための処理の計算をGPU を用いて行う手法を提案する.映像の安定化処理には,グローバルモーションの推定,振動補正,モザイキングの3 つの処理を行うが...
设计了一种基于图形处理器(GPU)的无缝地形渲染方法。该方法基于二叉树构建多层次地形网格,该网格用基于行、列号的地形模板表示。在设计过程中,将高程数据转化为适于GPU读取的高程纹理图,再通过顶点纹理提...
PCのグラフィックボード(GPU)の果たす役割は年々加速しており,CPU中心の計算環境からGPU中心の計算環境へと徐々に移行している.また,GPUの持つ機能をプログラムで利用できる環境が整ったことによ...
在GPU上进行多片元效果的绘制,已有的方法往往需要对模型进行多遍的数据读取,以进行片元的有效排序.由于往GPU传输数据的带宽限制,多遍的数据读取严重制约了绘制效率的提高.虽然,随着CUDA的出现,已有...
利用图形处理单元(graphic processing unit,GPU)进行通用计算近年来得到关注,Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC.很多计算在GPU上的速度远高于目前...
近年来,GPU在通用计算方面对传统的CPU应用发起了强有力的冲击,被广泛运用于各种高性能计算中,特别是网络安全领域。为了解决传统硬件加速存在的缺陷问题,首先介绍GPU的基本硬件架构及其并行计算原理,其...
GPU通用计算的出现为MD模拟计算性能的提升带来了一场技术革新。本文对支持MD模拟GPU加速的软件的计算性能进行了系统测试。以标准算例DHFR为测试基准,本文比较了三个典型MD软件在单GPU卡上的计算...
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计...
本文采用格子Boltzmann方法(LBM)在图形处理器(GPU)上计算了由静止圆柱阵列组成的团聚物周期单元内的不可压缩流体流动,流固交界面处采用直接反弹以实现无滑移边界,每个圆柱上的曳力通过统计动量...
图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用.提出了一个基于GPU片元程序计算B样条曲面的加速算法.通过测试算法在GPU上计算B样条曲面的时间与基于...
近年来GPU作为一种具有极强运算能力的多核处理器,得到了快速的发展,成为高性能计算领域的主要发展方向。各种分子动力学模拟的主流软件也纷纷使用GPU技术,其中LAMMPS较早地开发出了通用的并行GPU版...
粒子模拟是研究离散粒子和连续介质运动规律的常用方法。而大规模的粒子模拟通常借助高性能计算系统。近年来,得益于其众核架构,图形处理器(GPU)已成为高性能计算的重要设备,并被广泛用于大规模粒子模拟过程的...
卒業論文text画像認識に用いられる一般化ハフ変換は,ノイズや重なり,隠れに強いが処理速度が遅いとされているアルゴリズムである。この一般化ハフ変換の高速化を目的として,GPU (Graphics Pr...
背景:抗葡萄糖6磷酸异构酶(GPI)抗体在K/Bx N小鼠模型中起到致关节炎作用,大部分类风湿关节炎( RA)患者血清中存在高浓度的抗GPI抗体。目的:探讨血清GPI水平在 RA筛查诊断中的意义,以及...
通用目的图形处理器(GPGPU)在高性能计算(HPC)领域正得到越来越多的重视和应用。Mole-8.5作为世界上首套使用NVIDIA Tesla C2050的GPGPU超级计算系统,在颗粒流、多相流等...
この論文では,ビデオ映像に含まれる振動成分を取り除くための処理の計算をGPU を用いて行う手法を提案する.映像の安定化処理には,グローバルモーションの推定,振動補正,モザイキングの3 つの処理を行うが...
设计了一种基于图形处理器(GPU)的无缝地形渲染方法。该方法基于二叉树构建多层次地形网格,该网格用基于行、列号的地形模板表示。在设计过程中,将高程数据转化为适于GPU读取的高程纹理图,再通过顶点纹理提...
PCのグラフィックボード(GPU)の果たす役割は年々加速しており,CPU中心の計算環境からGPU中心の計算環境へと徐々に移行している.また,GPUの持つ機能をプログラムで利用できる環境が整ったことによ...
在GPU上进行多片元效果的绘制,已有的方法往往需要对模型进行多遍的数据读取,以进行片元的有效排序.由于往GPU传输数据的带宽限制,多遍的数据读取严重制约了绘制效率的提高.虽然,随着CUDA的出现,已有...