Amazon EC2 m6i-Instances boten eine bis zu 53 % bessere STREAM-Triad-Leistung als m5-Instances mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation
Die Probleme, mit denen Unternehmen heute konfrontiert sind, sind komplexer denn je, von sich verändernden Wettbewerbslandschaften bis hin zu Herausforderungen in der Lieferkette und darüber hinaus. Technologielösungen können nicht alle diese Probleme lösen – aber mit einer wachsenden Datenmenge, mit der gearbeitet werden muss, können sie sicherlich helfen. Je komplexer jedoch das Rechenproblem ist, desto mehr Ressourcen sind notwendig, um es zu lösen. Eine wichtige Ressource ist der Arbeitsspeicher: Da viele Anwendungen Daten im Arbeitsspeicher zwischenspeichern, um die Leistung zu verbessern, ist ein schneller Arbeitsspeicher mit hohem Durchsatz von entscheidender Bedeutung. Wenn sich Ihr Unternehmen dafür entschieden hat, Ihre HPC-Workloads (High Performance Computing) in der Cloud auszuführen, wie wählen Sie dann die richtige Instanz aus, um die Leistung zu maximieren?
Der STREAM Triad-Benchmark, der häufig beim HPC-Benchmarking verwendet wird, misst die nachhaltige Speicherbandbreite und liefert Durchsatzergebnisse in MB/s. Intel führte diesen Benchmark auf zwei Sätzen von Amazon Web Services (AWS) Elastic Compute Cloud (EC2)-Instanzen durch:
- m6i-Instances mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation
- m5-Instances mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation
Um die Leistungsunterschiede hervorzuheben, die mehrere Arten von Organisationen feststellen könnten, hat Intel beide Instanzen mit 8 vCPUs und dann noch einmal mit 16 vCPUs getestet. Die m6i-Instances boten bei beiden Instance-Größen einen deutlich besseren Durchsatz und übertrafen die m5-Instances um bis zu 53 %. Wenn Unternehmen über eine Investition in neuere EC2-Instanzen nachdenken, deuten diese Ergebnisse darauf hin, dass die Entscheidung für die m6i-Instanzen eine kluge Entscheidung wäre.
Höherer STREAM-Triaden-Durchsatz für kleinere Instanzen
Abbildung 1 zeigt die Ergebnisse des STREAM-Triad-Leistungstests auf 8-vCPU-Instances. Bei dieser kleineren Instanzgröße, die ideal für Unternehmen ist, die moderatere Arbeitslasten unterstützen möchten, bot die m6i-Instanz mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation eine um 53 % bessere Leistung als die m5-Instanz.
Höherer STREAM-Triaden-Durchsatz für Instanzen mittlerer Größe
Organisationen, die mehr Rechenleistung benötigen, können Instanzen mittlerer Größe auswählen, zum Beispiel solche mit 16 vCPUs. Bei dieser Größe bot die m6i-Instance mit den neuen skalierbaren Intel® Xeon® Prozessoren der 3. Generation einen um 38 % höheren STREAM Triad-Durchsatz als die m5-Instance mit Prozessoren der vorherigen Generation (siehe Abbildung 2).
Fazit
HPC-Workloads erfordern viel Leistung, um effektiv zu sein, und bei einer Vielzahl von Optionen in der Cloud kann es für Unternehmen schwierig sein, Optionen auszuwählen, die ihren Anforderungen entsprechen. Diese STREAM-Triad-Benchmarking-Ergebnisse zeigen, dass Unternehmen eine höhere Leistung erzielen könnten, wenn sie Amazon EC2 m6i-Instances mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation statt m5-Instances mit älteren skalierbaren Intel® Xeon® Prozessoren der 2. Generation auswählen.
Weitere Informationen
Um mit der Ausführung Ihrer HPC-Workloads auf Amazon EC2 m6i-Instances mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation zu beginnen, gehen Sie zu https://aws.amazon.com/ec2/instance-types/m6i/.
Tests wurde von Intel im Januar 2022 durchgeführt. Alle Konfigurationen verwendeten Ubuntu 20.04.3 LTS-Kernel 5.11.0-1022-aws auf AWS us-west=2 mit STREAM v5.10, ICC 2021.2-Compiler und setzten OMP_NUM_THREADS gleich # of vCPUs. Compiler-Flags: -O3 -qopt-streaming-stores=always -qopt-zmm-usage=high -xCORE-AVX512 -qopenmp -mcmodel=large -DSTREAM_ARRAY_SIZE=268435456. m5.2xlarge: Intel Xeon Platinum 8259CL, 8 Kerne, 32 GB RAM, bis zu 10 Gbit/s Netzwerk-BW, bis zu 4,75 Gbit/s Speicher-BW; m6i.2xlarge: Intel Xeon Platinum 8375C, 8 Kerne, 32 GB RAM, bis zu 10 Gbit/s Netzwerk-BW, bis zu 12,5 Gbit/s Speicher-BW; m5.4xlarge: Intel Xeon Platinum 8259CL, 16 Kerne, 64 GB RAM, bis zu 10 Gbit/s Netzwerk-BW, bis zu 4,75 Gbit/s Speicher-BW; m6i.4xlarge: Intel Xeon Platinum 8375C, 16 Kerne, 64 GB RAM, bis zu 10 Gbit/s Netzwerk-BW, bis zu 12,5 Gbit/s Speicher-BW.