L'utilisation d'architectures hétérogènes, combinant des processeurs multicoeurs avec des accélérateurs tels que les GPU, FPGA et Intel Xeon Phi, a augmenté ces dernières années. Les GPUs peuvent atteindre des performances significatives pour certaines catégories d'applications. Néanmoins, pour atteindre ces performances avec des API de bas niveau comme CUDA et OpenCL, il est nécessaire de réécrire le code séquentiel, de bien connaître l’architecture des GPUs et d’appliquer des optimisations complexes, parfois non portables. D'autre part, les modèles de programmation basés sur des directives (par exemple, OpenACC, OpenMP) offrent une abstraction de haut niveau du matériel sous-jacent, simplifiant ainsi la maintenance du code et améliorant l...
Error correcting codes i.e. LDPC (Low Density Parity Check) and Turbo-codes are the foundation of co...
Le travail présenté dans ce mémoire étudie et propose des modèles de calcul parallèles de type cellu...
La généralisation des processeurs multi-coeurs rendant la plupart des machines disponibles parallèle...
L'utilisation d'architectures hétérogènes, combinant des processeurs multicoeurs avec des accélérate...
Afin d'exploiter les capacités des architectures parallèles telles que les grappes, les grilles, les...
La prolifération des architectures multi-coeurs est source d’unepression importante pour les develop...
International audienceIn this paper, we present GPU and CPU optimization results of a Discontinuous ...
Les phénomènes physiques complexes peuvent être simulés numériquement par des techniques mathématiqu...
This work takes part in the context of high-performance computing on heterogeneous architectures. Ru...
Graphic cards (GPUs), initially used for graphic processing, have a highly parallel architecture. In...
Ce manuscrit s'inscrit dans le domaine du calcul intensif (HPC) où le besoin croissant de performanc...
Les phénomènes physiques complexes peuvent être simulés numériquement par des techniques mathématiqu...
On the field of parallel programing has seen arrive a new big player in the last 10 years. The GPU's...
Les systèmes multiprocesseurs sur puce électronique (On-Chip Multiprocessor [OCM]) sont considérés c...
Les machines multiprocesseurs, multi-cœurs et les accélérateurs de type GPU se généralisen...
Error correcting codes i.e. LDPC (Low Density Parity Check) and Turbo-codes are the foundation of co...
Le travail présenté dans ce mémoire étudie et propose des modèles de calcul parallèles de type cellu...
La généralisation des processeurs multi-coeurs rendant la plupart des machines disponibles parallèle...
L'utilisation d'architectures hétérogènes, combinant des processeurs multicoeurs avec des accélérate...
Afin d'exploiter les capacités des architectures parallèles telles que les grappes, les grilles, les...
La prolifération des architectures multi-coeurs est source d’unepression importante pour les develop...
International audienceIn this paper, we present GPU and CPU optimization results of a Discontinuous ...
Les phénomènes physiques complexes peuvent être simulés numériquement par des techniques mathématiqu...
This work takes part in the context of high-performance computing on heterogeneous architectures. Ru...
Graphic cards (GPUs), initially used for graphic processing, have a highly parallel architecture. In...
Ce manuscrit s'inscrit dans le domaine du calcul intensif (HPC) où le besoin croissant de performanc...
Les phénomènes physiques complexes peuvent être simulés numériquement par des techniques mathématiqu...
On the field of parallel programing has seen arrive a new big player in the last 10 years. The GPU's...
Les systèmes multiprocesseurs sur puce électronique (On-Chip Multiprocessor [OCM]) sont considérés c...
Les machines multiprocesseurs, multi-cœurs et les accélérateurs de type GPU se généralisen...
Error correcting codes i.e. LDPC (Low Density Parity Check) and Turbo-codes are the foundation of co...
Le travail présenté dans ce mémoire étudie et propose des modèles de calcul parallèles de type cellu...
La généralisation des processeurs multi-coeurs rendant la plupart des machines disponibles parallèle...