Professur für Höchstleistungsrechnen


Beschreibung:

Die Forschungsaktivitäten der Professur sind an der Schnittstelle zwischen numerischer Anwendung und modernen parallelen Hochleistungsrechnern angesiedelt. Zentrales Arbeitsgebiet ist die effiziente Implementierung, Optimierung und Parallelisierung numerischer Methoden und Anwendungsprogrammen auf heterogenen, (hoch) parallelen Rechnern. Dabei werden innovative Optimierungs- und Parallelisierungsansätze entwickelt, welche sich an den besonderen Eigenschaften neuartiger Rechnerarchitekturen orientieren. Verfolgt wird bei den Forschungsarbeiten ein strukturierter Performancemodell-basierter Ansatz (Performance Engineering). Darüber hinaus werden einfache Werkzeuge entwickelt die den Prozess des Performance Engineering unterstützen. Anwendungsorientierte Schwerpunkte der Professur sind Stencil-basierte Applikationen sowie Basisoperationen und Eigenwertlöser für großer dünn besetzte Systeme. Verbunden ist die Professur mit der Gruppenleitung der HPC Gruppe des Regionalen Rechenzentrums Erlangen. 

Adresse:
Martensstraße 3
91058 Erlangen


Forschungsbereiche

Performance Engineering
Werkzeuge für Performancemodellierung und Performanceanalyse


Forschungsprojekt(e)

Go to first page Go to previous page 1 von 3 Go to next page Go to last page

(Energy Oriented Center of Excellence: toward exascale for energy):
EoCoE-II: Energy Oriented Center of Excellence: toward exascale for energy (Performance evaluation, modelling and optimization)
Prof. Dr. Gerhard Wellein
(01.01.2019 - 31.12.2021)


SeASiTe: Selbstadaption für zeitschrittbasierte Simulationstechniken auf heterogenen HPC-Systemen
Prof. Dr. Gerhard Wellein
(01.03.2017 - 29.02.2020)


ProPE: Prozessorientierte Dienststruktur für Perfomance Engineering von wissenschaftlicher Software an deutschen HPC-Zentren
Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


MeTacca: Metaprogrammierung für Beschleunigerarchitekturen
Prof. Dr. Harald Köstler; Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


(SPP 1648: Software for Exascale Computing):
SPPEXA: Eigenwertlöser für dünn besetzte Matrixprobleme: Skalierbare Software für Exascale-Anwendungen II (ESSEX-II)
Prof. Dr. Gerhard Wellein
(01.01.2016 - 31.12.2018)



Publikationen (Download BibTeX)

Go to first page Go to previous page 2 von 5 Go to next page Go to last page

Feichtinger, C., Habich, J., Köstler, H., Rüde, U., & Aoki, T. (2015). Performance Modeling and Analysis of Heterogeneous Lattice Boltzmann Simulations on CPU-GPU Clusters. Parallel Computing, 46, 1-13. https://dx.doi.org/10.1016/j.parco.2014.12.003
Gmeiner, B., Rüde, U., Stengel, H., Waluga, C., & Wohlmuth, B.I. (2015). Towards Textbook Efficiency for Parallel Multigrid. Numerical Mathematics-Theory Methods and Applications, 8(1), 22-46. https://dx.doi.org/10.4208/nmtma.2015.w10si
Hammer, J., Hager, G., Eitzinger, J., & Wellein, G. (2015). Automatic loop kernel analysis and performance modeling with kerncraft. Association for Computing Machinery, Inc.
Klawonn, A., Lanser, M., Rheinbach, O., Stengel, H., & Wellein, G. (2015). Hybrid MPI/OpenMP Parallelization in FETI-DP Methods. In Recent Trends in Computational Engineering - CE2014 (pp. 67-84). -: Springer Link.
Kreutzer, M., Hager, G., Wellein, G., Alvermann, A., Fehske, H., & Pieper, A. (2015). Performance Engineering of the Kernel Polynomal Method on Large-Scale CPU-GPU Systems. In IEEE (Eds.), Proceedings of the 2015 IEEE International Parallel and Distributed Processing Symposium (IPDPS) (pp. 417-426). Hyderabad, India, IN.
Hofmann, J., Fey, D., Eitzinger, J., Hager, G., & Wellein, G. (2015). Performance analysis of the Kahan-enhanced scalar product on current multicore processors. In Accepted for PPAM 2015 (pp. 1-10). Krakow, Poland, PL.
Wellein, G., Eitzinger, J., Hager, G., & Röhl, T. (2015). Overhead Analysis of Performance Counter Measurements. (pp. 176-185). Institute of Electrical and Electronics Engineers Inc..
Röhrig-Zöllner, M., Thies, J., Kreutzer, M., Alvermann, A., Pieper, A., Basermann, A.,... Fehske, H. (2015). Increasing the performance of the Jacobi-Davidson method by blocking. SIAM Journal on Scientific Computing, DLR Portal ISSN 1064-8275, 1-27. https://dx.doi.org/10.1137/140976017
Wittmann, M., Hager, G., Zeiser, T., Treibig, J., & Wellein, G. (2015). Chip-level and multi-node analysis of energy-optimized lattice Boltzmann CFD simulations. Concurrency and Computation-Practice & Experience, 1-5. https://dx.doi.org/10.1002/cpe.3489
Wellein, G., Hager, G., Stengel, H., Keyes, D., Malas, T., & Ltaief, H. (2015). Multicore-optimized wavefront diamond blocking for optimizing stencil updates. SIAM Journal on Scientific Computing, 37(4), C439-C464. https://dx.doi.org/10.1137/140991133
Gmeiner, B., Rüde, U., Stengel, H., Waluga, C., & Wohlmuth, B.I. (2015). Performance and Scalability of Hierarchical Hybrid Multigrid Solvers for Stokes Systems. SIAM Journal on Scientific Computing, 37(2), C143 - C 168. https://dx.doi.org/10.1137/130941353
Shahzad, F., Kreutzer, M., Zeiser, T., Machado, R., Pieper, A., Hager, G., & Wellein, G. (2015). Building a Fault Tolerant Application Using the GASPI Communication Layer. In Proceedings of FTS 2015 (pp. 580-587). Chicago, IL: in conjunction with IEEE Cluster 2015: IEEE.
Selgrad, K., Lier, A., Wittmann, M., Lohmann, D., & Stamminger, M. (2014). Defmacro for C: Lightweight, Ad Hoc Code Generation. In Verna, Didier (Eds.), Proceedings of ELS 2014 7th European Lisp Symposium (pp. 80-87). Paris, FR.
Hofmann, J., Eitzinger, J., Hager, G., & Wellein, G. (2014). Comparing the Performance of Different x86 SIMD Instruction Sets for a Medical Imaging Application on Modern Multi- and Manycore Chips. In Proceedings of the 2014 Workshop on Programming models for SIMD/Vector processing (pp. 57-64). Orlando, USA: New York, NY, USA: ACM.
Wittmann, M., Zeiser, T., Hager, G., & Wellein, G. (2014). Modeling and analyzing performance for highly optimized propagation steps of the lattice Boltzmann method on sparse lattices.
Kreutzer, M., Hager, G., Wellein, G., Fehske, H., & Bishop, A.R. (2014). A unified sparse matrix data format for efficient general sparse matrix-vector multiplication on modern processors with wide SIMD units. SIAM Journal on Scientific Computing, 36(5), C401–C423. https://dx.doi.org/10.1137/130930352
Eitzinger, J., Hager, G., Wellein, G., & Stengel, H. (2014). Quantifying performance bottlenecks of stencil computations using the Execution-Cache-Memory model. (pp. 1-10). Association for Computing Machinery.
Hofmann, J., Eitzinger, J., Hager, G., & Wellein, G. (2014). Performance Engineering for a Medical Imaging Application on the Intel Xeon Phi Accelerator. In ARCS Workshops'14 (pp. 1-8). Lübeck, Germany, DE.
Shahzad, F., Wittmann, M., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2013). PGAS implementation of SpMVM and LBM with GPI. In Proceedings of the 7th International Conference on PGAS Programming Models (pp. 172-184). Edinburgh, Scotland, UK: Edinburgh: The University of Edinburgh.
Pieper, A., Schubert, G., Wellein, G., & Fehske, H. (2013). Effects of disorder and contacts on transport through graphene nanoribbons. Physical Review B, 88, 195409. https://dx.doi.org/10.1103/PhysRevB.88.195409


Zusätzliche Publikationen (Download BibTeX)


Shahzad, F., Thies, J., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2018). CRAFT: A library for easier application-level Checkpoint/Restart and Automatic Fault Tolerance. IEEE Transactions on Parallel and Distributed Systems. https://dx.doi.org/10.1109/TPDS.2018.2866794

Zuletzt aktualisiert 2018-20-09 um 05:09