Professur für Höchstleistungsrechnen


Beschreibung:

Die Forschungsaktivitäten der Professur sind an der Schnittstelle zwischen numerischer Anwendung und modernen parallelen Hochleistungsrechnern angesiedelt. Zentrales Arbeitsgebiet ist die effiziente Implementierung, Optimierung und Parallelisierung numerischer Methoden und Anwendungsprogrammen auf heterogenen, (hoch) parallelen Rechnern. Dabei werden innovative Optimierungs- und Parallelisierungsansätze entwickelt, welche sich an den besonderen Eigenschaften neuartiger Rechnerarchitekturen orientieren. Verfolgt wird bei den Forschungsarbeiten ein strukturierter Performancemodell-basierter Ansatz (Performance Engineering). Darüber hinaus werden einfache Werkzeuge entwickelt die den Prozess des Performance Engineering unterstützen. Anwendungsorientierte Schwerpunkte der Professur sind Stencil-basierte Applikationen sowie Basisoperationen und Eigenwertlöser für große dünn besetzte Systeme. Verbunden ist die Professur mit der Gruppenleitung der HPC Gruppe des Regionalen Rechenzentrums Erlangen. 

Adresse:
Martensstraße 3
91058 Erlangen


Forschungsbereiche

Hardwareeffiziente Bausteine für dünn besetzte lineare Algebra und stencil-basierten Verfahren
Performance Engineering
Werkzeuge für Performancemodellierung und Performanceanalyse


Forschungsprojekt(e)

Go to first page Go to previous page 1 von 3 Go to next page Go to last page

(Energy Oriented Center of Excellence: toward exascale for energy):
EoCoE-II: Energy Oriented Center of Excellence: toward exascale for energy (Performance evaluation, modelling and optimization)
Prof. Dr. Gerhard Wellein
(01.01.2019 - 31.12.2021)


SeASiTe: Selbstadaption für zeitschrittbasierte Simulationstechniken auf heterogenen HPC-Systemen
Prof. Dr. Gerhard Wellein
(01.03.2017 - 29.02.2020)


ProPE: Prozessorientierte Dienststruktur für Perfomance Engineering von wissenschaftlicher Software an deutschen HPC-Zentren
Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


MeTacca: Metaprogrammierung für Beschleunigerarchitekturen
Prof. Dr. Gerhard Wellein; Prof. Dr. Harald Köstler
(01.01.2017 - 31.12.2019)


(SPP 1648: Software for Exascale Computing):
SPPEXA: Eigenwertlöser für dünn besetzte Matrixprobleme: Skalierbare Software für Exascale-Anwendungen II (ESSEX-II)
Prof. Dr. Gerhard Wellein
(01.01.2016 - 31.12.2018)



Publikationen (Download BibTeX)

Go to first page Go to previous page 5 von 5 Go to next page Go to last page

Hager, G., Zeiser, T., Eitzinger, J., & Wellein, G. (2006). Optimizing performance on modern HPC systems: learning from simple kernel benchmarks. In Computational Science and High Performance Computing II (pp. 273-287). Stuttgart, Germany, DE: Berlin Heidelberg: Springer-Verlag.
Lammers, P., Wellein, G., Zeiser, T., Hager, G., & Breuer, M. (2006). Have the Vectors the Continuing Ability to Parry the Attack of the Killer Micros? In High Performance Computing on Vector Systems: Proceedings of the High Performance Computing Center Stuttgart, March 2005 (pp. 25-37). Berlin Heidelberg: Springer.
Wellein, G., Lammers, P., Hager, G., Donath, S., & Zeiser, T. (2006). Towards optimal performance for lattice Boltzmann applications on terascale computers. In Parallel Computational Fluid Dynamics: Theory and Applications, Proceedings of the 2005 International Conference on Parallel Computational Fluid Dynamics (pp. 31-40). -: Elsevier.
Iglberger, K., Rüde, U., Feichtinger, C., Wellein, G., Hager, G., & Nitsure, A. (2006). Optimization of Cache Oblivious Lattice Boltzmann Method in 2D and 3D. In Simulationstechnique - 19th Symposium in Hannover, September 2006 (pp. 265-270). Hannover: Erlangen: SCS Publishing House.
Wellein, G., Zeiser, T., Hager, G., & Donath, S. (2006). On the single processor performance of simple lattice Boltzmann kernels. Computers & Fluids, 35(8-9: Proceedings of the First International Conference for Mesoscopic Methods in Engineering and Science), 910-919. https://dx.doi.org/10.1016/j.compfluid.2005.02.008
Hager, G., Bergen, B., Lammers, P., & Wellein, G. (2005). Taming the Bandwidth Behemoth. First Experiences on a Large SGI Altix System. Innovatives Supercomputing in Deutschland : inSiDE, 3(2), 24.
Deserno, F., Hager, G., Brechtefeld, F., & Wellein, G. (2005). Performance of Scientific Applications on Modern Supercomputers. In High Performance Computing in Science and Engineering Munich 2004 Transactions of the Second Joint HLRB and KONWIHR Status and ResultWorkshop, March 2-3, 2004, Technical University of Munich, andLeibniz-Rechenzentrum Munich, Germany. (pp. 3-36). München: Berlin Heidelberg: Springer.
Donath, S., Zeiser, T., Hager, G., Habich, J., & Wellein, G. (2005). Optimizing performance of the lattice Boltzmann method for complex structures on cache-based architectures. In Frontiers in Simulation: Simulationstechnique, 18th Symposium in Erlangen, September 2005 (ASIM) (pp. 728-735). Erlangen: SCS Publishing House.
Pohl, T., Thürey, N., Deserno, F., Rüde, U., Lammers, P., Wellein, G., & Zeiser, T. (2004). Performance Evaluation of Parallel Large-Scale Lattice Boltzmann Applications on Three Supercomputing Architectures. In Friedrich-Alexander-Universität Erlangen-Nürnberg (Eds.), Supercomputing, 2004: Proceedings of the ACM/IEEE SC2004 Conference (pp. 1-13). Pittsburgh, PA, USA: Institute of Electrical and Electronics Engineers Inc..
Pohl, T., Thürey, N., Deserno, F., Rüde, U., Lammers, P., Wellein, G., & Zeiser, T. (2004). Performance Evaluation of Parallel Large-Scale Lattice Boltzmann Applications on Three Supercomputing Architectures.
Hager, G., Deserno, F., & Wellein, G. (2003). Pseudo-Vectorization and RISC Optimization Techniques for the Hitachi SR8000 Architecture. In High Performance Computing in Science and Engineering, Munich 2002: Transactions of the First Joint HLRB and KONWIHR Status and Result Workshop, October 10-11, Technical University of Munich, Germany. (pp. 425-442). München: New York, LLC: Springer-Verlag.


Zusätzliche Publikationen (Download BibTeX)


Shahzad, F., Thies, J., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2018). CRAFT: A library for easier application-level Checkpoint/Restart and Automatic Fault Tolerance. IEEE Transactions on Parallel and Distributed Systems. https://dx.doi.org/10.1109/TPDS.2018.2866794

Zuletzt aktualisiert 2019-24-04 um 10:15