Adaptive checkpointing in dynamic grids for uncertain job durations

Chtepen, Maria
Dhoedt, Bart
De Turck, Filip
Demeester, Piet
Claeys, FHA
Vanrolleghem, Peter A

Open link

Publication date

January 2009

DOI

10.1109/ITI.2009.5196152

Publisher

University of Zagreb. SRCE University Computing Centre

Citation count (estimate)

Abstract

Adaptive checkpointing is a relatively new approach that is particularly suitable for providing fault-tolerance in dynamic and unstable grid environments. The approach allows for periodic modification of checkpointing intervals at run-time, when additional information becomes available. In this paper an adaptive algorithm, named MeanFailureCP+, is introduced that deals with checkpointing of grid applications with execution times that are unknown a priori. The algorithm modifies its parameters, based on dynamically collected feedback on its performance. Simulation results show that the new algorithm performs even better than adaptive approaches that make use of exact information on job execution times

Extracted data

We use cookies to provide a better user experience.

Data Protection

Adaptive checkpointing in dynamic grids for uncertain job durations

Abstract

Extracted data

Adaptive checkpointing in dynamic grids for uncertain job durations

Abstract

Extracted data

Related items

Related items