GROMACS-Leistung auf Intel Instanzen auf AWS

Warum Intel für HPC in der Cloud

  • Technologiepartnerschaften mit führenden Komponentenanbietern zur Optimierung von Intel® CPUs.

  • Fundierte Kooperationen mit der ISV- und HPC-Community, die sich auf die Optimierung führender HPC-Codes konzentrieren.

  • Skalierbarkeit und Flexibilität für unterschiedliche Workloads in der Cloud-Umgebung.

author-image

Von

Intel Instanzen für HPC-Workloads

Die folgenden Tests wurden auf AWS-Instanzen durchgeführt, die auf verschiedenen Generationen von Intel® Xeon® Prozessoren in einer Hyperthread-Konfiguration basieren. Dieser spezielle Prozessor kann eine All-Core-Turbotaktfrequenz von bis zu 3,5 GHz erreichen und verwendet Intel® Turbo-Boost-Technik 2.0, Intel® Advanced Vector Extensions 512 (Intel® AVX-512) und Intel® Deep Learning Boost. Diese neuen Angebote bieten ein besseres Nutzenversprechen für universelle und speicherintensive Workloads im Vergleich zur vorherigen Generation (z. B. erhöhte Skalierbarkeit und eine höherwertige CPU-Klasse), einschließlich einer besseren Leistung.

Was ist GROMACS?

Die GROMACS-Anwendung ist eine rechenlastige Anwendung (FLOPS). Die Workloads in dieser Anwendung sind für jede Kommunikation (Socket-Socket, CPU-GPU und Multi-Knoten) latenzempfindlich. Sie nutzt Vorteile von AVX-512 (Y), rechenlastig (Y) (außer Ionchannel – es ist MPI-lastig auf 8-16 Knoten), Vorteile von Turbo (Y), Vorteile von HT/SMT (Y).

Die Workloads, die wir für unser Benchmarking berücksichtigt haben, sind öffentlich verfügbar:

  • Lignocellulose (3M Atome, RF-Typ); Lignocellulose ist als Beispiel für die Demonstration der Skalierbarkeit nützlich.
  • Water_rf (1,5M Atome, RF-Typ)

Informationen zu Workloads und Konfigurationen finden Sie unten. Die Ergebnisse können von Fall zu Fall abweichen.

Konfiguration von C6i.32xlarge – Skalierbarer Intel® Xeon® Prozessor der 3. Generation @ 2,9 GHz, 256 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 50 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

Konfiguration von C5n.18xlarge – Skalierbarer Intel® Xeon® Prozessor @ 2,9 GHz, 192 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 100 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

Konfiguration von M6i.32xlarge – Skalierbarer Intel® Xeon® Prozessor der 3. Generation @ 2,9 GHz, 512 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 50 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

Informationen zu Workloads und Konfigurationen finden Sie unten. Die Ergebnisse können von Fall zu Fall abweichen.

Konfiguration von C6i.32xlarge – Skalierbarer Intel® Xeon® Prozessor der 3. Generation @ 2,9 GHz, 256 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 50 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

Konfiguration von C5n.18xlarge – Skalierbarer Intel® Xeon® Prozessor @ 2,9 GHz, 192 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 100 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

Konfiguration von M6i.32xlarge – Skalierbarer Intel® Xeon® Prozessor der 3. Generation @ 2,9 GHz, 512 GB Arbeitsspeicherkapazität, Netzwerkbandbreite 50 Gbit/s, CentOS Linux 7 Release Kernel 3.10.0-1160.45.1.el7.x86_64, GROMACS-Version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library für Linux OS, Version 2021.4 Build 20210831 (ID: 758087adf), getestet von Intel am 9.11.2021.

So erhalten Sie Intel Vorteile

Skalierbare Intel Xeon Prozessoren der 3. Generation bieten erhebliche Leistungssteigerungen für den GROMACS-Workload und werden von Intel AVX-512 und Intel Deep Learning Boost-Technik beschleunigt. Diese Beschleunigung bietet erhebliche Vorteile bei einer niedrigeren Knotenzahl (mehr als 2-fach). Das wird eingeschränkt, wenn man auf eine größere Knotenzahl skaliert, aufgrund der geringeren Netzwerkbandbreite von C6i.32xlarge und M6i.32xlarge. Kunden, die diesen GROMACS-Workload ausführen, können erhebliche Leistungssteigerungen erzielen, indem sie auf skalierbare Intel Xeon Instanztypen der 3. Generation bei AWS (M6i, C6i) umsteigen, im Vergleich zu skalierbaren Intel Xeon Prozessoren der vorherigen Generation bei AWS.
Ressourcen: www.intel.de/HPC