GPU-Boost für Ansys Fluent

Die Nutzung der Rechenleistung von Grafikprozessoren (GPUs) eröffnet bei Strömungssimulationen ganz neue Möglichkeiten im Hinblick auf Rechenzeiten und Leistungsfähigkeit. In Ansys Fluent ist die Nutzung der GPU-Technologie bereits nativ implementiert. Dr. Thomas Zeiser vom Zentrum für Nationales Hochleistungsrechnen Erlangen (NHR@FAU) hat sich ihre Performance näher angeschaut.

Header_Blog_FAU-GPU-Benchmaks
© Ansys 

Strömungssimulationen sind rechenintensiv, insbesondere weil bei Computational Fluid Dynamics (CFD) der Detaillierungsgrad der Modelle für die Ergebnisse eine wesentliche Rolle spielt. So führen transiente Modelle mit vielen kleinen Zeitschritten zu aufwändigen Rechnungen, die konventionell kaum in einem vertretbaren Zeitfenster bearbeitet werden können. Über High Performance Computing (HPC) können gängige CFD-Aufgaben immerhin über Nacht oder übers Wochenende gelöst werden – auf CPU-Basis.

Schneller geht es, wenn die Rechenleistung des Grafikprozessors genutzt wird. Ansys hat das Potenzial von GPUs früh erkannt. Weil Schnelligkeit wichtig ist, gehört die GPU-Technologie zu den Top-Entwicklungsthemen von Ansys. Seit 2022 wird Ansys Fluent für die GPU von Grund auf neu programmiert. Mit Erfolg: Die Leistungsfähigkeit zeigt sich in Benchmarks, die von unabhängigen Institutionen wie dem Zentrum für Nationales Hochleistungsrechnen Erlangen (NHR@FAU) an der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) bestätigt werden. Angenehme Nebeneffekte sind der gesunkene Energiebedarf und geringere Investitionskosten.

Warum sind GPUs so schnell?

Das Design und die Architektur von Grafikprozessoren sind von Haus aus schon für die parallele Verarbeitung von Daten optimiert. Von ihren tausenden Rechenkernen profitieren Operationen, die sich gut in kleine Pakete aufteilen lassen. Außer auf Grafikanwendungen, für die sie entwickelt wurden, trifft dies auch auf numerische Simulationen zu. Zusätzliche Beschleunigungen resultieren aus ihrer Speicherbandbreite und dem immens schnellen Cache.

Benchmarks am Nationalen Hochleistungsrechenzentrum in Erlangen

Teaser_Blog_FAU-GPU-Benchmaks_Fritz-Alex-Cluster

„Fritz“ und „Alex“, die Cluster der Friedrich-Alexander-Universität | © MEGWARE Computer und vertrieb Computer GmbH

Dr. Thomas Zeiser legt Wert auf die Feststellung, kein Ansys- oder Simulationsexperte zu sein. Als Leiter der Abteilung System & Services am NHR@FAU ist er aber ein Fachmann zum Thema Rechenleistung. Sein Blick auf das, was rechenintensive Software wie Ansys Fluent unter HPC-Bedingungen leistet und auf Vergleiche der Performance unter CPU- und GPU-Nutzung, ist objektiv.

Die HPC-Rechenleistung seiner Cluster, die passend zum Namen der Hochschule „Fritz“ und „Alex“ heißen, steht Forschenden der FAU und Wissenschaftlerinnen aus ganz Deutschland zur Verfügung. Ausgestattet ist die FAU auch mit einem großen Ansys Academic Multiphysics und HPC-Lizenzpool.

Die für Ansys Fluent angekündigte Leistungsexplosion durch GPU – und zwar nicht als Unterstützung der CPU, sondern nativ und standalone – hat Thomas Zeiser neugierig gemacht: Er hat sie einem umfassenden Benchmarking unterzogen und mit dem „klassischen“ Ansatz auf CPU-Basis verglichen. Sein Fazit: „Fluent auf GPU performt tatsächlich so gut, wie es der Hersteller, Ansys, behauptet! Und dabei muss es nicht einmal die teuerste und vermeintlich leistungsfähigste GPU sein, in einer Single Precision Anwendung reicht ein Standardprodukt für die in Aussicht gestellte Performance aus.“

Ansys CFD

Strömungen von Fluiden sichtbar machen mit Computational Fluid Dynamics (CFD). Partikelströme und Materialflüsse analysieren mit Discrete-Element-Methode (DEM) und SPH (Smoothed-Particle Hydrodynamics).

Testversion anfordern

CFD-1

GPU vs. CPU: Performance-Studie

Thomas Zeiser betrachtet die GPU-Performance als IT-Spezialist und Hardware-Fachmann: Für die Vergleichbarkeit zieht er das physikalische Grundprinzip „Arbeit pro Zeit“ heran und nutzt als Kriterium zur Bewertung „MIUPS“ (Million Cell Iterations Per Wall Second). MIUPS beschreibt die Leistungsfähigkeit der Hardware für die reine Lösungszeit mittels der in einer Sekunde durchgeführten Iterationen pro eine Million Zellen, so dass die Leistungsangabe unabhängig von der Größe des Rechengitters ist.

Fluent auf GPU performt tatsächlich so gut, wie es der Hersteller, Ansys, behauptet!
Dr. Thomas Zeiser
Zentrum für Nationales Hochleistungsrechnen Erlangen

Bei seinen Performance-Vergleich betrachtete Thomas Zeiser einen Querschnitt an Beispielen von Ansys, u.a. Fahrzeug-Außenströmungen, Verbrennungsprozesse und Mischvorgänge. Wichtig: Die Studien basieren auf Benchmarks, wurden also unter „Laborbedingungen“ und in einer Single Precision Umgebung durchgeführt - es zählt die reine Rechenpower. Zusätzliche Auswerteschritte, Animationen oder Reports wurden ausgeschaltet. Die Ergebnisse und ihre Vergleichbarkeit adressieren daher die reine Hardware-Technik.

Blog_FAU-GPU-Benchmaks_Performance-Vergleich

Performance-Vergleich von GPU- und CPU-Benchmarks | © NHR / CADFEM 

Gerechnet wurde zunächst auf CPU-Basis auf dem Cluster „Fritz“, unter Einsatz von 1 – 8 Knoten mit jeweils zwei Intel Xeon Platinum 8470 ("Sapphire Rapids"), das entspricht 104-832 CPU-Kernen. Für den Vergleich sind auch die Kurven wichtig, die am Ende nicht mehr ansteigen, also eine (Leistungs-)Sättigung erreichen: diese Modelle sind für so große Rechen-Ressourcen schlicht zu klein und können nicht effizient parallelisiert werden.

Die GPU-Performance auf der Nvidia A40, einer für Single Precision optimierten Karte, die in der industriellen Praxis bei CFD-Simulationen allerdings eher die Ausnahme ist – hier ist aus Genauigkeitsgründen meist Double Precision üblich -, zeigt ähnliche Kurvenverläufe und ist fast überall um etwa den Faktor 2 besser als der CPU-Cluster. Hierbei wird die Anzahl der GPU-Karten der Anzahl an Netzwerkknoten mit jeweils 104 CPUs gegenübergestellt. Mit der Nvidia A100 wird die Performance noch einmal um rund 80% verbessert.

Über NHR und FAU

In Deutschland gibt es für Forschende und Wissenschaftler insgesamt neun vom Bundesministerium für Bildung und Forschung sowie den jeweiligen Landesministerien geförderte universitätsnahe Nationale Hochleistungsrechenzentren. Das NHR@FAU in Erlangen gehört zur Friedrich-Alexander-Universität Erlangen-Nürnberg, die aktuellen Großrechner heißen „Fritz“ und „Alex“. 

Benchmark Außenströmung

Genauer betrachtet wird der Ansys-Benchmark der Außenströmung. Bei dieser CFD-Simulation mit rund 250 Millionen Zellen werden neben Rechenzeit auch Energieverbrauch und Investitionskosten verglichen. Als Referenzgröße dient wieder die klassische Berechnung auf CPU-Basis. Sie wird auf dem Cluster „Fritz“ mit 8 Rechenknoten mit jeweils zwei Intel Xeon Platinum 8470 ("Sapphire Rapids") und damit 104 CPU-Cores pro Knoten, also 832 Kernen, durchgeführt.

Ergebnis: Nvidia A100 Grafikkarten führen dieselbe Rechnung unter Berücksichtigung der Start-, Partitionierungs- und Initialisierungszeiten von Fluent in nur 12% der CPU-Zeit durch, bei der Nvidia A40 sind es 20%. Statt 16 kWh ist der Energieverbrauch bei der A100 nur 2,5 kWh, bei der A40 3,8 kWh. Die Konstellation mit der A40 hat sich als die kostengünstigste Variante entpuppt, wobei zu beachten ist, dass sie als Single Precision Karte für den CFD-Einsatz (wo häufig Double Precision empfohlen wird) nur bedingt geeignet ist. Der Vorteil einer zwar erheblich teureren A100 (oder aktuell einer H100) liegt hingegen vor allem darin, dass sie auch dann schnell ist, wenn eben mit doppelter Genauigkeit gerechnet werden muss.

Blog_FAU-GPU-Benchmaks_Vergleich-Energiebedarf-Kosten

Vergleich von Energiebedarf und Kosten bei GPU- und CPU-Einsatz | © NHR / CADFEM 

Mit den CADFEM IT-Services zur optimalen Rechenlösung

Die Ergebnisse des NHR zeigen: „Die eine“ Hardwarelösung für Ansys Fluent Simulationsaufgaben (bzw. auch andere Ansys Anwendungen) gibt es meist nicht. Grundsätzlich gilt, dass durch die Nutzung von GPUs CFD-Berechnungen mit Ansys Fluent massiv beschleunigt werden. Das impliziert, dass auch beim Detaillierungsgrad oder der Nutzung von KI-Methoden kaum noch Abstriche gemacht werden müssen. Welche Konstellation im Praxisbetrieb letztendlich ideal ist, hängt von sehr vielen Faktoren ab: Von der Aufgabe selbst, der Netzqualität, aber auch von der verfügbaren Infrastruktur und anderen Ressourcen, von Zeit- oder Geldbudgets.

Genau hier greift der CADFEM IT-Service: Unsere sowohl von den Herstellern als auch von Ansys zertifizierten IT-Experten unterstützen CADFEM Kunden bei der Auswahl der optimalen Rechenlösung und beziehen darin alle Einflussfaktoren mit ein.

110-ansys-cfd-efficient-usage-of-ansys-fluent-18028

 

Seminar: 110% Ansys CFD – Ansys Fluent effizient nutzen

In dieser Schulung lernen Sie Tipps, Tricks und Lösungsstrategien zur effizienten Strömungssimulation mit Ansys Fluent kennen.

Info & Anmeldung

Autor

Alexander Kunz

CADFEM Germany GmbH

+49 (0)8092 7005-889
akunz@cadfem.de

Redaktion

Klaus Kuboth

CADFEM Germany GmbH

+49 (0)8092 7005-279
kkuboth@cadfem.de