Professur für Höchstleistungsrechnen


Beschreibung:

Die Forschungsaktivitäten der Professur sind an der Schnittstelle zwischen numerischer Anwendung und modernen parallelen Hochleistungsrechnern angesiedelt. Zentrales Arbeitsgebiet ist die effiziente Implementierung, Optimierung und Parallelisierung numerischer Methoden und Anwendungsprogrammen auf heterogenen, (hoch) parallelen Rechnern. Dabei werden innovative Optimierungs- und Parallelisierungsansätze entwickelt, welche sich an den besonderen Eigenschaften neuartiger Rechnerarchitekturen orientieren. Verfolgt wird bei den Forschungsarbeiten ein strukturierter Performancemodell-basierter Ansatz (Performance Engineering). Darüber hinaus werden einfache Werkzeuge entwickelt die den Prozess des Performance Engineering unterstützen. Anwendungsorientierte Schwerpunkte der Professur sind Stencil-basierte Applikationen sowie Basisoperationen und Eigenwertlöser für großer dünn besetzte Systeme. Verbunden ist die Professur mit der Gruppenleitung der HPC Gruppe des Regionalen Rechenzentrums Erlangen. 

Adresse:
Martensstraße 3
91058 Erlangen


Forschungsbereiche

Performance Engineering
Werkzeuge für Performancemodellierung und Performanceanalyse


Forschungsprojekt(e)

Go to first page Go to previous page 1 von 3 Go to next page Go to last page

(Energy Oriented Center of Excellence: toward exascale for energy):
EoCoE-II: Energy Oriented Center of Excellence: toward exascale for energy (Performance evaluation, modelling and optimization)
Prof. Dr. Gerhard Wellein
(01.01.2019 - 31.12.2021)


SeASiTe: Selbstadaption für zeitschrittbasierte Simulationstechniken auf heterogenen HPC-Systemen
Prof. Dr. Gerhard Wellein
(01.03.2017 - 29.02.2020)


ProPE: Prozessorientierte Dienststruktur für Perfomance Engineering von wissenschaftlicher Software an deutschen HPC-Zentren
Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


MeTacca: Metaprogrammierung für Beschleunigerarchitekturen
Prof. Dr. Harald Köstler; Prof. Dr. Gerhard Wellein
(01.01.2017 - 31.12.2019)


(SPP 1648: Software for Exascale Computing):
SPPEXA: Eigenwertlöser für dünn besetzte Matrixprobleme: Skalierbare Software für Exascale-Anwendungen II (ESSEX-II)
Prof. Dr. Gerhard Wellein
(01.01.2016 - 31.12.2018)



Publikationen (Download BibTeX)

Go to first page Go to previous page 1 von 5 Go to next page Go to last page

Shahzad, F., Thies, J., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2018). CRAFT: A library for easier application-level Checkpoint/Restart and Automatic Fault Tolerance. IEEE Transactions on Parallel and Distributed Systems. https://dx.doi.org/10.1109/TPDS.2018.2866794
Wittmann, M., Haag, V., Zeiser, T., Köstler, H., & Wellein, G. (2018). Lattice Boltzmann benchmark kernels as a testbed for performance analysis. Computers & Fluids, 172, 582-592. https://dx.doi.org/10.1016/j.compfluid.2018.03.030
Kreutzer, M., Ernst, D., Bishop, A.R., Fehske, H., Hager, G., Nakajima, K., & Wellein, G. (2018). Chebyshev filter diagonalization on modern manycore processors and GPGPUs. Springer Verlag.
Hofmann, J., Fey, D., Riedmann, M., Eitzinger, J., Hager, G., & Wellein, G. (2017). Performance analysis of the Kahan-enhanced scalar product on current multi-core and many-core processors. Concurrency and Computation-Practice & Experience, 29(9). https://dx.doi.org/10.1002/cpe.3921
Hammer, J., Eitzinger, J., Hager, G., & Wellein, G. (2017). Kerncraft: A Tool for Analytic Performance Modeling of Loop Kernels. In Niethammer C, Gracia J, Hilbrich T, Knüpfer A, Resch MM, Nagel WE (Eds.), Tools for High Performance Computing 2016 (pp. 1--22). Stuttgart, Germany: Cham: Springer International Publishing.
Röhl, T., Eitzinger, J., Hager, G., & Wellein, G. (2017). LIKWID monitoring stack: A flexible framework enabling job specific performance monitoring for the masses. (pp. 781-784). Institute of Electrical and Electronics Engineers Inc..
Hofmann, J., Hager, G., Wellein, G., & Fey, D. (2017). An Analysis of Core- and Chip-Level Architectural Features in Four Generations of Intel Server Processors. In High Performance Computing. ISC 2017. Lecture Notes in Computer Science, vol 10266. Frankfurt: Cham: Springer.
Galgon, M., Krämer, L., Lang, B., Alvermann, A., Fehske, H., Pieper, A.,... Thies, J. (2017). Improved coefficients for polynomial filtering in ESSEX. (pp. 63-79). Springer Verlag.
Anzt, H., Gates, M., Dongarra, J., Kreutzer, M., Wellein, G., & Köhler, M. (2017). Preconditioned Krylov solvers on GPUs. Parallel Computing, 68, 32-44. https://dx.doi.org/10.1016/j.parco.2017.05.006
Wellein, G., Alvermann, A., Fehske, H., Hager, G., Kreutzer, M., Lang, B.,... Galgon, M. (2016). High-performance implementation of Chebyshev filter diagonalization for interior eigenvalue computations. Journal of Computational Physics, 325, 226-243. https://dx.doi.org/10.1016/j.jcp.2016.08.027
Hager, G., Eitzinger, J., Habich, J., & Wellein, G. (2016). Exploring performance and power properties of modern multi-core chips via simple machine models. Concurrency and Computation-Practice & Experience, 28(2), 189-210. https://dx.doi.org/10.1002/cpe.3180
Anzt, H., Kreutzer, M., Ponce, E., Peterson, G.D., Wellein, G., & Dongarra, J. (2016). Optimization and performance evaluation of the IDR iterative Krylov solver on GPUs. International Journal of High Performance Computing Applications. https://dx.doi.org/10.1177/1094342016646844
Anzt, H., Dongarra, J., Kreutzer, M., Wellein, G., & Köhler, M. (2016). Efficiency of general Krylov methods on GPUs - An experimental study. (pp. 683-691). IEEE Computer Society.
Thies, J., Galgon, M., Shahzad, F., Alvermann, A., Kreutzer, M., Pieper, A.,... Wellein, G. (2016). Towards an exascale enabled sparse solver repository. Springer Verlag.
Kreutzer, M., Thies, J., Röhrig-Zöllner, M., Pieper, A., Shahzad, F., Galgon, M.,... Wellein, G. (2016). GHOST: Building Blocks for High Performance Sparse Linear Algebra on Heterogeneous Systems. International Journal of Parallel Programming, 1-27. https://dx.doi.org/10.1007/s10766-016-0464-z
Hofmann, J., Fey, D., Eitzinger, J., Hager, G., & Wellein, G. (2016). Analysis of Intel's Haswell Microarchitecture Using the ECM Model and Microbenchmarks. In Architecture of Computing Systems -- ARCS 2016: 29th International Conference, Nuremberg, Germany, April 4-7, 2016, Proceedings (pp. 210-222). Nuremberg: Cham: Springer International Publishing.
Hofmann, J., Fey, D., Riedman, M., Eitzinger, J., Hager, G., & Wellein, G. (2016). Performance analysis of the Kahan-enhanced scalar product on current multi-corecore and many-core processors. Concurrency and Computation-Practice & Experience, 28(12). https://dx.doi.org/10.1002/cpe.3921
Hofmann, J., Fey, D., Eitzinger, J., Hager, G., & Wellein, G. (2016). Analysis of intel’s haswell microarchitecture using the ECM model and microbenchmarks. Springer Verlag.
Bauer, S., Bunge, H.-P., Drzisga, D.P., Gmeiner, B., Huber, M., John, L.,... Wohlmuth, B.I. (2016). Hybrid Parallel Multigrid Methods for Geodynamical Simulations. In Bungartz H., Neumann P., Nagel E. (Eds.), 113 (pp. 211-235). Berlin, Heidelberg, New York: Springer.
Feichtinger, C., Habich, J., Köstler, H., Rüde, U., & Aoki, T. (2015). Performance Modeling and Analysis of Heterogeneous Lattice Boltzmann Simulations on CPU-GPU Clusters. Parallel Computing, 46, 1-13. https://dx.doi.org/10.1016/j.parco.2014.12.003


Zusätzliche Publikationen (Download BibTeX)


Shahzad, F., Thies, J., Kreutzer, M., Zeiser, T., Hager, G., & Wellein, G. (2018). CRAFT: A library for easier application-level Checkpoint/Restart and Automatic Fault Tolerance. IEEE Transactions on Parallel and Distributed Systems. https://dx.doi.org/10.1109/TPDS.2018.2866794

Zuletzt aktualisiert 2018-20-09 um 05:09