EventosEn procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

noticia

2022-12-07Sistema HPC y monitoreo de trabajos con LLview

RISC2 | LLview es una infraestructura cibernética con un software fácil de usar y adaptable para monitorear sistemas de computación de alto rendimiento.

Con la aparición de grandes máquinas heterogéneas, en el rango de Exascale, los desafíos de monitorear sistemas tan grandes aumentan significativamente. Para abordar eso, LLview se encuentra en desarrollo continuo para funcionar con una amplia gama de sistemas de hardware e interfaces de software con una sobrecarga insignificante y, al mismo tiempo, brinda acceso rápido y confiable a informes de trabajo, datos de monitoreo de todo el sistema y en tiempo real. información del sistema. Esa información se proporciona a los usuarios del sistema, asesores de proyectos, equipos de soporte y administradores del sistema, ayudando a la gestión de trabajos, identificación de problemas de rendimiento en muchos niveles y también ayudar a los administradores del sistema a encontrar fallas y mal funcionamiento del sistema. Este seminario web brinda una descripción general de los diferentes componentes de LLview y su interacción entre ellos y el sistema. Además, se presta especial atención a las vistas de supervisión del sistema y las funciones de informes de trabajos, ya que permiten rastrear todo el ciclo de vida de un trabajo y pueden ayudar a identificar problemas y cuellos de botella en una etapa muy temprana.

Acerca de los oradores:

Vitor Silva  recibió su título en Ciencias de la Computación de la Universiade Federal de Minas Gerais. Obtuvo su maestría en Ingeniería de Sistemas y Computación de la Universidade Federal do Rio de Janeiro y luego recibió su doctorado de la Universidade Federal de Minas Gerais, esta vez en Ingeniería Nuclear. Trabajó como desarrollador de software en el campo del procesamiento de imágenes digitales, pero la mayor parte de su carrera fue en el campo de la Ingeniería Nuclear, trabajando principalmente con el modelado por computadora y resolviendo problemas de Neutrónica y Termohidráulica relacionados con reactores nucleares. También fue el administrador principal de un pequeño sistema de clúster instalado desde cero. Desde 2021 trabaja en el Centro de Supercomputación de Jülich con herramientas de monitorización y simulación.

Filipe Guimarães es físico computacional. Graduado en Física, M.Sc en Física y Doctorado en Física por la Universidade Federal Fluminense. Ha estado trabajando con High Performance Computing desde 2014, inicialmente desde el lado del usuario, pero pasó al lado de soporte en 2020. Desde entonces, uno de sus enfoques fue mejorar las herramientas de monitoreo utilizadas y desarrolladas en el Centro de Supercomputación de Jülich.

Sobre el moderador:  Esteban Mocskos es profesor de tiempo completo de la Universidad de Buenos Aires (UBA) e investigador del Centro de Simulación por Computadora (CSC-CONICET). Recibió su Ph.D. en Ciencias de la Computación de la UBA en 2008 y fue postdoctorado en el grupo de Modelado de Proteínas de la UBA. Sus intereses de investigación incluyen sistemas distribuidos y blockchain, redes informáticas, arquitectura de procesadores y programación paralela. Forma parte del comité directivo de la conferencia latinoamericana HPC CARLA y miembro del comité E del Sistema Nacional HPC de Argentina. 

editor
Fuente
RISC2

El proyecto europeo RISC2 tiene como objetivo crear una red para apoyar la coordinación de la investigación en computación de alto rendimiento entre Europa y América Latina.

Información del evento

  • Barcelona - España
  • 7 Diciembre 2022
  • +34 93 413 77 16
  • Mail
  • Web