2015 IEEE/ACM International Symposium on Code Generation and Optimization 978-1-4799-8161-8/15/$31.00 ©2015 IEEE Automatic Data Placement into GPU On-Chip Memory Resources

Chao Li
Yi Yang
Zhen Lin
Huiyang Zhou

Publication date

January 2016

Abstract

Although graphics processing units (GPUs) rely on thread-level parallelism to hide long off-chip memory access latency, judicious utilization of on-chip memory resources, including register files, shared memory, and data caches, is critical to application performance. However, explicitly managing GPU on-chip memory resources is a non-trivial task for application developers. More importantly, as on-chip memory resources vary among different GPU generations, performance portability has become a daunting challenge. In this paper, we tackle this problem with compiler-driven automatic data placement. We focus on programs that have already been reasonably optimized either manually by programmers or automatically by compiler tools. Our proposed co...

Extracted data

We use cookies to provide a better user experience.

Data Protection

2015 IEEE/ACM International Symposium on Code Generation and Optimization 978-1-4799-8161-8/15/$31.00 ©2015 IEEE Automatic Data Placement into GPU On-Chip Memory Resources

Abstract

Extracted data

2015 IEEE/ACM International Symposium on Code Generation and Optimization 978-1-4799-8161-8/15/$31.00 ©2015 IEEE Automatic Data Placement into GPU On-Chip Memory Resources

Abstract

Extracted data

Related items

Related items