Professur für Höchstleistungsrechnen


Beschreibung:

Die Forschungsaktivitäten der Professur sind an der Schnittstelle zwischen numerischer Anwendung und modernen parallelen Hochleistungsrechnern angesiedelt. Zentrales Arbeitsgebiet ist die effiziente Implementierung, Optimierung und Parallelisierung numerischer Methoden und Anwendungsprogrammen auf heterogenen, (hoch) parallelen Rechnern. Dabei werden innovative Optimierungs- und Parallelisierungsansätze entwickelt, welche sich an den besonderen Eigenschaften neuartiger Rechnerarchitekturen orientieren. Verfolgt wird bei den Forschungsarbeiten ein strukturierter Performancemodell-basierter Ansatz (Performance Engineering). Darüber hinaus werden einfache Werkzeuge entwickelt die den Prozess des Performance Engineering unterstützen. Anwendungsorientierte Schwerpunkte der Professur sind Stencil-basierte Applikationen sowie Basisoperationen und Eigenwertlöser für große dünn besetzte Systeme. Verbunden ist die Professur mit der Gruppenleitung der HPC Gruppe des Regionalen Rechenzentrums Erlangen. 

Adresse:
Martensstraße 3
91058 Erlangen


Forschungsbereiche

Hardwareeffiziente Bausteine für dünn besetzte lineare Algebra und stencil-basierten Verfahren
Performance Engineering
Werkzeuge für Performancemodellierung und Performanceanalyse


Forschungsprojekt(e)

Go to first page Go to previous page 1 von 3 Go to next page Go to last page

(Energy Oriented Center of Excellence: toward exascale for energy):
EoCoE-II: Energy Oriented Center of Excellence: toward exascale for energy (Performance evaluation, modelling and optimization)
Prof. Dr. Gerhard Wellein
(01.01.2019 - 31.12.2021)


SeASiTe: Selbstadaption für zeitschrittbasierte Simulationstechniken auf heterogenen HPC-Systemen
Prof. Dr. Gerhard Wellein
(01.03.2017 - 29.02.2020)


ProPE: Prozessorientierte Dienststruktur für Perfomance Engineering von wissenschaftlicher Software an deutschen HPC-Zentren
Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


MeTacca: Metaprogrammierung für Beschleunigerarchitekturen
Prof. Dr. Gerhard Wellein; Prof. Dr. Harald Köstler
(01.01.2017 - 31.12.2019)


(SPP 1648: Software for Exascale Computing):
SPPEXA: Eigenwertlöser für dünn besetzte Matrixprobleme: Skalierbare Software für Exascale-Anwendungen II (ESSEX-II)
Prof. Dr. Gerhard Wellein
(01.01.2016 - 31.12.2018)



Publikationen (Download BibTeX)

Go to first page Go to previous page 3 von 5 Go to next page Go to last page

Selgrad, K., Lier, A., Wittmann, M., Lohmann, D., & Stamminger, M. (2014). Defmacro for C: Lightweight, Ad Hoc Code Generation. In Verna, Didier (Eds.), Proceedings of ELS 2014 7th European Lisp Symposium (pp. 80-87). Paris, FR.
Eitzinger, J., Hager, G., Wellein, G., & Stengel, H. (2014). Quantifying performance bottlenecks of stencil computations using the Execution-Cache-Memory model. (pp. 1-10). Association for Computing Machinery.
Eitzinger, J., Hager, G., Hofmann, H., Hornegger, J., & Wellein, G. (2013). Pushing the limits for medical image reconstruction on recent standard multicore processors. International Journal of High Performance Computing Applications, 27(2), 162-177. https://dx.doi.org/10.1177/1094342012442424
Shahzad, F., Wittmann, M., Zeiser, T., Hager, G., & Wellein, G. (2013). An Evaluation of Different I/O Techniques for Checkpoint/Restart. In Parallel and Distributed Processing Symposium Workshops PhD Forum (IPDPSW), 2013 IEEE 27th International (pp. 1708-1716). Boston, MA, USA: n.a.: IEEE Digital Library.
Shahzad, F., Wittmann, M., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2013). PGAS implementation of SpMVM and LBM with GPI. In Proceedings of the 7th International Conference on PGAS Programming Models (pp. 172-184). Edinburgh, Scotland, UK: Edinburgh: The University of Edinburgh.
Shahzad, F., Wittmann, M., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2013). A survey of checkpoint/restart techniques on distributed memory systems. Parallel Processing Letters, 23(04), 1340011-1340030. https://dx.doi.org/10.1142/S0129626413400112
Pieper, A., Schubert, G., Wellein, G., & Fehske, H. (2013). Effects of disorder and contacts on transport through graphene nanoribbons. Physical Review B, 88, 195409. https://dx.doi.org/10.1103/PhysRevB.88.195409
Wittmann, M., Hager, G., Wellein, G., Zeiser, T., & Krammer, B. (2013). MPC and CoArray Fortran: Alternatives to classic MPI implementations on the examples of scalable lattice boltzmann flow solvers. (pp. 367-372). Stuttgart.
Wittmann, M., Zeiser, T., Hager, G., & Wellein, G. (2013). Comparison of Different Propagation Steps for Lattice Boltzmann Methods. Computers & Mathematics With Applications, 65(6), 924-935. https://dx.doi.org/10.1016/j.camwa.2012.05.002
Sembritzki, K., Hager, G., Krammer, B., Eitzinger, J., & Wellein, G. (2012). Evaluation of the Coarray Fortran Programming Model on the Example of a Lattice Boltzmann Code. In PGAS12 (pp. -). Santa Barbara, CA, USA: In Press: ACM Digital Library.
Hager, G., Eitzinger, J., Wellein, G., & Habich, J. (2012). Exploring performance and power properties of modern multicore chips via simple machine models. Concurrency and Computation-Practice & Experience, Submitted, 22.
Eitzinger, J., Hager, G., & Wellein, G. (2012). Performance Patterns and Hardware Metrics on Modern Multicore Processors: Best Practices for Performance Engineering. In Euro-Par 2012 (pp. -). Rhodes Island, Greece, GR: -: -.
Wittmann, M., Zeiser, T., Hager, G., & Wellein, G. (2012). Domain Decomposition and Locality Optimization for Large-Scale Lattice Boltzmann Simulations. Computers & Fluids. https://dx.doi.org/10.1016/j.compfluid.2012.02.007
Shahzad, F., Wittmann, M., Zeiser, T., & Wellein, G. (2012). Asynchronous Checkpointing by Dedicated Checkpoint Threads. In Recent Advances in the Message Passing Interface (pp. 289-290). -: Springer-verlag.
Habich, J., Feichtinger, C., Köstler, H., Hager, G., & Wellein, G. (2012). Performance Engineering for the Lattice Boltzmann Method on GPGPUs: Architectural Requirements and Performance Results. Computers & Fluids, 10. https://dx.doi.org/10.1016/j.compfluid.2012.02.013.
Feichtinger, C., Köstler, H., Hager, G., Rüde, U., Wellein, G., & Habich, J. (2011). A flexible Patch-based lattice Boltzmann parallelization approach for heterogeneous GPU-CPU clusters. Parallel Computing, 37(9), 536-549. https://dx.doi.org/10.1016/j.parco.2011.03.005
Bader, M., Mehl, M., Rüde, U., & Wellein, G. (2011). Simulation software for supercomputers. Journal of Computational Science, 2(2), 93-94. https://dx.doi.org/10.1016/j.jocs.2011.05.003
Schubert, G., Hager, G., Fehske, H., & Wellein, G. (2011). Parallel sparse matrix-vector multiplication as a test case for hybrid MPI OpenMP programming. In Proceedings of the 25th IEEE International Parallel and Distributed Processing Symposium, Workshops and Phd Forum, IPDPSW 2011 (pp. 1751-1758). Anchorage, AK.
Hager, G., Wellein, G., Schubert, G., & Fehske, H. (2011). Hybrid-parallel sparse matrix-vector multiplication with explicit communication overlap on current multicore-based systems. Parallel Processing Letters, 21(3), 339-358. https://dx.doi.org/10.1142/S0129626411000254
Eitzinger, J., Wellein, G., & Hager, G. (2011). Efficient multicore-aware parallelization strategies for iterative stencil computations. Journal of Computational Science, 2(2), 130–137. https://dx.doi.org/10.1016/j.jocs.2011.01.010


Zusätzliche Publikationen (Download BibTeX)


Shahzad, F., Thies, J., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2018). CRAFT: A library for easier application-level Checkpoint/Restart and Automatic Fault Tolerance. IEEE Transactions on Parallel and Distributed Systems. https://dx.doi.org/10.1109/TPDS.2018.2866794

Zuletzt aktualisiert 2019-24-04 um 10:15