Hardwareeffiziente Bausteine für dünn besetzte lineare Algebra und stencil-basierten Verfahren


Organisationseinheit:
Professur für Höchstleistungsrechnen

Beschreibung:

Die Lösung großer dünn besetzten Gleichungssysteme und Eigenwertprobleme geschieht typischerweise mit Hilfe iterativer Verfahren.  Der vorliegende Forschungsbereich beschäftigt sich mit der effizienten Implementierung, Optimierung und Parallelisierung der wichtigsten Grundbausteine solcher Löser. Im Mittelpunkt steht dabei die Multiplikation einer großen dünn besetzten Matrix mit einem oder mehreren Vektoren (spMV). Betrachtet werden sowohl matrixfreie Darstellungen für reguläre Matrizen wie sie etwa bei Diskretisierungen von PDEs ("Stencils") auftreten als auch der generische Fall einer allgemeinen spMV mit abgespeicherter Matrix.


Forschungsprojekt(e)


SeASiTe: Selbstadaption für zeitschrittbasierte Simulationstechniken auf heterogenen HPC-Systemen
Prof. Dr. Gerhard Wellein
(01.03.2017 - 29.02.2020)
(SPP 1648: Software for Exascale Computing):
SPPEXA: Eigenwertlöser für dünn besetzte Matrixprobleme: Skalierbare Software für Exascale-Anwendungen II (ESSEX-II)
Prof. Dr. Gerhard Wellein
(01.01.2016 - 31.12.2018)
(SPP 1648: Software for Exascale Computing):
ESSEX - Equipping Sparse Solvers for Exascale
Dr. Georg Hager; Prof. Dr. Gerhard Wellein
(01.11.2012 - 30.06.2019)



Zugewiesene Publikationen


Anzt, H., Kreutzer, M., Ponce, E., Peterson, G.D., Wellein, G., & Dongarra, J. (2018). Optimization and performance evaluation of the IDR iterative Krylov solver on GPUs. International Journal of High Performance Computing Applications, 32(2), 220-230. https://dx.doi.org/10.1177/1094342016646844
Wellein, G., Hager, G., Stengel, H., Keyes, D., Malas, T., & Ltaief, H. (2015). Multicore-optimized wavefront diamond blocking for optimizing stencil updates. SIAM Journal on Scientific Computing, 37(4), C439-C464. https://dx.doi.org/10.1137/140991133
Kreutzer, M., Hager, G., Wellein, G., Alvermann, A., Fehske, H., & Pieper, A. (2015). Performance Engineering of the Kernel Polynomal Method on Large-Scale CPU-GPU Systems. In IEEE (Eds.), Proceedings of the 2015 IEEE International Parallel and Distributed Processing Symposium (IPDPS) (pp. 417-426). Hyderabad, India, IN.
Kreutzer, M., Hager, G., Wellein, G., Fehske, H., & Bishop, A.R. (2014). A unified sparse matrix data format for efficient general sparse matrix-vector multiplication on modern processors with wide SIMD units. SIAM Journal on Scientific Computing, 36(5), C401–C423. https://dx.doi.org/10.1137/130930352
Hager, G., Wellein, G., Schubert, G., & Fehske, H. (2011). Hybrid-parallel sparse matrix-vector multiplication with explicit communication overlap on current multicore-based systems. Parallel Processing Letters, 21(3), 339-358. https://dx.doi.org/10.1142/S0129626411000254
Schubert, G., Hager, G., Fehske, H., & Wellein, G. (2011). Parallel sparse matrix-vector multiplication as a test case for hybrid MPI OpenMP programming. In Proceedings of the 25th IEEE International Parallel and Distributed Processing Symposium, Workshops and Phd Forum, IPDPSW 2011 (pp. 1751-1758). Anchorage, AK.
Wellein, G., Hager, G., Zeiser, T., Wittmann, M., & Fehske, H. (2009). Efficient temporal blocking for stencil computations by multicore-aware wavefront parallelization. In Proceedings of 2009 33rd Annual IEEE International Computer Software and Applications Conference (pp. 579-586). Seattle, USA: IEEE Computer Society: IPSJ/IEEE SAINT Conference, DOI 10.1109/COMPSAC.2009.82.

Zuletzt aktualisiert 2019-11-04 um 14:21