Fast recursive matrix multiplication for multi-core architectures

Rünger, Gudula
Schwind, Michael

Open link

Publication date

May 2010

DOI

10.1016/j.procs.2010.04.009

Publisher

Published by Elsevier B.V.

Abstract

AbstractIn this article, we present a fast algorithm for matrix multiplication optimized for recent multicore architectures. The implementation exploits different methodologies from parallel programming, like recursive decomposition, efficient low-level implementations of basic blocks, software prefetching, and task scheduling resulting in a multilevel algorithm with adaptive features. Measurements on different systems and comparisons with GotoBLAS, Intel Math Kernel Library (IMKL), and AMD Core Math Library (AMCL) show that the matrix implementation presented has a very high efficiency

Extracted data

We use cookies to provide a better user experience.

Data Protection

Fast recursive matrix multiplication for multi-core architectures

Abstract

Extracted data

Fast recursive matrix multiplication for multi-core architectures

Abstract

Extracted data

Related items

Related items