El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedades y tasas de errores, intervalos de detección más largos y fallos silenciosos. Se proyecta que, en sistemas de exa-escala, los errores ocurran varias veces al día y se propaguen para generar desde caídas de procesos hasta corrupciones de resultados debidas a fallos no detectados. En este trabajo se describe la utilización de SEDAR, una herramienta que permite detectar fallos transitorios en aplicaciones MPI, y recuperar automáticamente las ejecuciones, posibilitando su finalización con resultados fiables. La detección se basa en replicación de procesamiento y monitorización del envío de mensajes y del cómputo local, mientras que la recuperaci...
Debido a la aparición de nuevas tecnologías, dispositivos inteligentes, medios de comunicación y apl...
En la actualidad, el desarrollo de sistemas software tolerante a fallos se realiza a un nivel depend...
Los clústeres de computadoras para Computación de Alto Desempeño (HPC) permiten acceder a relativame...
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedade...
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedade...
El objetivo de mejorar el rendimiento en las computadoras actuales ha producido el reto de utilizar ...
Mientras el rendimiento de los sistemas de computación de altas prestaciones continúa creciendo, las...
Dentro de la línea de investigación que se está desarrollando, existen varios enfoques. Por un lado ...
La Computación de Altas Prestaciones a través de clusters de computadores basados en Workstation y r...
El consumo energético se ha vuelto uno de los mayores desafíos en el campo de la computación de alta...
En este trabajo se presenta una metodología de diseño de redes de sensores dedicada al monitoreo est...
En la actualidad, para abordar problemas de mayor tamaño y complejidad estudios de ciencia básica y ...
Actualmente, y debido al continuo aumento en la escala de integración, la tasa de fallos en los sist...
Durante los últimos años, los sistemas de cómputo de altas prestaciones hicieron posible el tratamie...
El rendimiento de un sistema paralelo depende tanto de la configuración de recursos de la computador...
Debido a la aparición de nuevas tecnologías, dispositivos inteligentes, medios de comunicación y apl...
En la actualidad, el desarrollo de sistemas software tolerante a fallos se realiza a un nivel depend...
Los clústeres de computadoras para Computación de Alto Desempeño (HPC) permiten acceder a relativame...
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedade...
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedade...
El objetivo de mejorar el rendimiento en las computadoras actuales ha producido el reto de utilizar ...
Mientras el rendimiento de los sistemas de computación de altas prestaciones continúa creciendo, las...
Dentro de la línea de investigación que se está desarrollando, existen varios enfoques. Por un lado ...
La Computación de Altas Prestaciones a través de clusters de computadores basados en Workstation y r...
El consumo energético se ha vuelto uno de los mayores desafíos en el campo de la computación de alta...
En este trabajo se presenta una metodología de diseño de redes de sensores dedicada al monitoreo est...
En la actualidad, para abordar problemas de mayor tamaño y complejidad estudios de ciencia básica y ...
Actualmente, y debido al continuo aumento en la escala de integración, la tasa de fallos en los sist...
Durante los últimos años, los sistemas de cómputo de altas prestaciones hicieron posible el tratamie...
El rendimiento de un sistema paralelo depende tanto de la configuración de recursos de la computador...
Debido a la aparición de nuevas tecnologías, dispositivos inteligentes, medios de comunicación y apl...
En la actualidad, el desarrollo de sistemas software tolerante a fallos se realiza a un nivel depend...
Los clústeres de computadoras para Computación de Alto Desempeño (HPC) permiten acceder a relativame...