Se presentan implementaciones en arquitectura CUDA (Compute Unified Device Architecture) de un método de volumen finito equilibrado para resolver un modelo de aguas poco profundas. La plataforma CUDA permite ejecutar programas en paralelo en la GPU. Se presentan cuatro versiones del algoritmo CUDA además de una implementación en CPU. Cada versión mejora a la anterior. Presentamos las siguientes técnicas para optimizar un programa CUDA: limitar el uso de registros, cambiar el patrón de acceso a la memoria global y utilizar el desenrollado de bucles. La precisión de todos los programas se investiga en 3 casos de prueba: una rotura de presa circular en un lecho seco, una rotura de presa circular en un lecho húmedo y un flujo de rotura de presa sobre tres jorobas. La última versión paralela muestra un aumento de velocidad de 3,84x respecto a la primera implementación CUDA. Utilizamos nuestro programa para simular un problema real basado en una supuesta rotura parcial de la presa Srinakarin, situada en la provincia de Kanchanaburi, Tailandia. La simulación muestra que la fuerte interacción entre los flujos masivos de agua y las elevaciones del fondo en condiciones húmedas y secas está bien capturada por el esquema bien equilibrado, mientras que el programa paralelo optimizado produce una aceleración de 57,32x sobre la versión serie.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Comparación de las prestaciones de un eje rotatorio suspendido por cojinetes magnéticos activos radiales de 4 ejes mediante μ-síntesis, diseño de forma de bucle y Sub(H)∞ con incertidumbres.
Artículo:
Reconocimiento de emociones del habla en corpus cruzados basado en el aprendizaje de núcleos múltiples de coincidencia conjunta de muestras y características
Artículo:
Evaluación de la precisión de las coordenadas tridimensionales mediante medición videogramétrica de alta velocidad
Artículo:
Algunos aspectos de la modelización estructural de la acumulación de daños y los procesos de fractura en estructuras metálicas a baja temperatura
Artículo:
Modelado y diagnóstico de fallos de cortocircuito entre fases para motores síncronos de imanes permanentes de cinco fases