Führen Sie Ihre HPC-Anwendungen schneller aus
Intels Investition in unabhängige Software-Anbieter (ISVs) bedeutet, dass kommerzielle HPC-Anwendungen so konzipiert sind, dass sie auf Intel® Architektur schneller ablaufen.
Warum Intel?
Pervasives HPC Portfolio
Intel® Lösungen für HPC gehen über den Prozessor hinaus und umfassen Arbeitsspeicher, Datenspeicher, Netzwerktechnik und Software. Viele Ingenieure und Entwickler sind bereits für den Aufbau von Systemen mit Intel Technik ausgebildet, was zu schnellen Implementierungen mit geringem Risiko und geringer TCO führt.
Leistungsstarke Entwickler-Tools
Intel bietet exklusive Toolkits wie Intel® oneAPI, Intel® MKL, Intel® MPI und Intel® Compiler, die für unglaubliche Leistung auf Intel® Architektur optimiert sind.
Führende Rolle bei Open Source
Intel arbeitet mit Open-Source-Communitys für Software zusammen, wie GROMACS, LAMMPS, NAMD, WRF, Relion und OpenFOAM. Intel ist der führende Linux-Mitwirkende bei Open-Source-Frameworks und trägt dazu bei, Lösungen für die globale Community zugänglicher zu machen.
Weitere Informationen über Intel® Open-Source-Softwaresupport
Leistung durch Partnerschaft
Als Branchenführer im HPC arbeitet Intel mit Softwareanbietern wie Ansys, Altair, Quantifi und Dassault zusammen und bietet gleichzeitig Marketing- und technische Expertise sowie Ressourcen. Diese Beziehungen sorgen dafür, dass beliebte HPC-Lösungen die Fähigkeiten der Intel® Hardware und Software voll nutzen können, damit Endkunden außergewöhnliche Leistung und Preise genießen.
HPC Zielsegmente
DIe HPC-Anwendungen von Softwareanbietern nutzen skalierbare Intel® Xeon® Prozessoren mit erwiesen hoher Leistung1 und die höchste verfügbare Speicherbandbreite in einer HPC-CPU.2 Diese Verbesserungen zusammen mit den revolutionären Arbeits- und Datenspeicherfähigkeiten der Intel® Optane™ Technik unterstützen rechen- und speicherintensive Workloads in fortgeschrittenen HPC-Anwendungsfällen in verschiedenen Bereichen.
HPC in der Fertigung
Intel gestützte HPC-Anwendungen ermöglichen schnelles Rendering und Simulation für das computergestützte Design (CAD), CFD-Analyse (Computational Fluid Dynamics), die Finite-Elemente-Analyse (FEA) und andere Bereiche. Diese Optimierungen ermöglichen es Produktdesignern, schnelle Iterationen durchzuführen, bessere Produkte zu entwickeln, die Prototypenentwicklung zu beschleunigen und schneller auf den Markt zu kommen, was einen extremen Wettbewerbsvorteil bietet.
- Führen Sie Ansys-Fluent-Simulationen auf Intel mit hoher Geschwindigkeit aus
- Beschleunigen Sie LS-DYNA Berechnungen und Simulationen
- Intel, Altair und Dell Solutions ermöglichen es PING, erstklassige Golfausrüstungen zu entwerfen
- JSP verbessert die Leistung von Ansys für Fertigungssimulationen
- Wie Intel und Ansys zusammen die Leistung maximieren
Gesundheitswesen und Biowissenschaften
Mit verbesserter Leistung zur Beschleunigung der genomischen Analyse, Sequenzierung und medizinischer Bildsegmentation kombiniert mit wichtigen Daten- und Arbeitsspeicherlösungen, die Datenbestände mit wachsender Größe verarbeiten, ermöglichen HPC-Anwendungen mit Intel Technik die Grenzen für die Forschung und Entdeckungen im Gesundheitswesen ständig auszudehnen.
- Beschleunigung der Inferenz auf AMAX Deep Learning All-in-One-Systemen
- HPC mit Intel Technik beschleunigt die RNA-Sequenzierung für einzelne Zellen
- Südafrikanische CHPC mobilisierte Intel HPC-Cluster zur Bekämpfung von COVID-19
- HPC verbessert Effizienz für die HYHY medizinische Bildgebung mit KI
- Intel, TGen und Dell ermöglichen die genomische Sequenzierung der nächsten Generation
Finanzdienstleistungen
HPC-Anwendungen mit Intel Technik wirken sich auf den Sektor der Finanzdienstleistungen aus, indem sie die Fähigkeiten für die Bewertung von Risiken, Betrugserkennung und den Warenterminhandel verbessern. Finanzunternehmen profitieren von einem deutlichen Wettbewerbsvorteil, da sie mehr Daten verarbeiten und schnellere Transaktionen unterstützen können.
HPC-KI-Konvergenz
Die für Konvergenz entwickelten und für alle wichtigen KI-Frameworks optimierten skalierbaren Intel® Xeon® Prozessoren sind die einzigen HPC-CPUs im Mainstreamsegment mit integrierter Künstlicher Intelligenz. Intel® AVX-512 beschleunigt das KI-Modelltraining durch Reduzierung der Rechenanforderungen beim Umstieg von FP32- auf INT8-Datentypen. Intel® Deep Learning Boost (Intel® DL Boost) bietet bis zu 11x bessere KI-Inferenz im Vergleich zur vorigen Generation auf ResNet-50.3
Middleware und Tools
Zu den Angeboten wichtiger Softwarefirmen gehören auch Middleware und Tools, welche die Verwaltung von HPC-Clustern mit Intel Technik und der integrierten Daten erleichtern, die Ergebnisse beschleunigen oder eine umfangreiche UI für eine bessere Benutzerfreundlichkeit ermöglichen. Intel Partnerschaften mit Middleware-Anbietern stellen sicher, dass Endbenutzer von hoher Optimierung auf der Intel® Architektur profitieren.
HPC ISV-Anwendungen in der Cloud
ISV-Partneranwendungen die auf Intel® Architektur optimiert wurden, bieten die gleiche Leistung hausintern oder in der Cloud. Viele Softwareanbieter hosten Anwendungen in der Cloud, kombinieren Anwendungen mit bestimmten Cloud-Instanzen oder unterstützen Sie beim Onboarding bei wichtigen Cloud-Service-Providern (CSPs).
Setzen Sie Ihre HPC-ISV-Reise fort
Info über weitere Ressourcen im Zusammenhang mit HPC-Anwendungen.
Intel® Partner Alliance
Beschleunigen Sie Ihr Wachstum mit exklusiven Möglichkeiten.
How Wonderful Gets Done
Erfahren Sie, was skalierbare Intel® Xeon® Prozessoren der 3. Generation für HPC tun können.
KI-Supercomputing ist die Zukunft
Die Leistung der HPC-Simulation trifft auf das Potenzial der KI.
Das Intel® oneAPI HPC Toolkit
Vertraute Bibliotheken und Compiler, die für Intel® Hardware optimiert sind.
Produkte und Technik
Optimieren Sie die Leistung und beschleunigen Sie wichtige Workloads für HPC, KI und Cloud-Konvergenz.
Produkt- und Leistungsangaben
HPCG: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: 2019u5 MKL; Build Notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel MPI 2019u8; Threads/Kern: 1; Turbo: used; Build knobs: -O3 -ip -xCORE-AVX512. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: 2019u5 MKL; Build notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel MPI 2019u8; threads/core: 1; Turbo: used; Build knobs: -O3 -ip -march=core-avx2, getestet von Intel, Ergebnisse Stand April 2021. HPL: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: The Intel Distribution for LINPACK Benchmark; Build Notes: Tools: Intel MPI 2019u7; Threads/Kerne: 1; Turbo: used; Build: Build-Script von Intel Distribution for LINPACK Package; 1 Rang pro NUMA Knoten: 1 Rang pro Steckplatz, EPYC 7543: 1-Knoten, 2-Steckplatz AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: AMD offizielle HPL 2.3 MT Version mit BLIS 2.1; Build Notes: Tools: hpc-x 2.7.0; threads/core: 1; Turbo: used; Build: pre-built binary (gcc built) von https://developer.amd.com/amd-aocl/blas-library/; 1 Rang pro L3 Cache, 4 Threads pro Rang, getestet von Intel, Ergebnisse Stand April 2021. STREAM Triad: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: McCalpin_STREAM_OMP-version; Build Notes: Tools: Intel C Compiler 2019u5; Threads/Kern: 1; Turbo: used; BIOS-Einstellungen: HT=on Turbo=On SNC=On. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: McCalpin_STREAM_OMP-version; Build notes: Tools: Intel C Compiler 2019u5; Threads/Kern: 1; Turbo: used; BIOS settings: HT=on Turbo=On SNC=On, getestet von Intel, Ergebnisse Stand April 2021. WRF Geomean of Conus-12km, Conus-2.5km, NWSC-3 NA-3km: Platinum 8358: 1-Knoten 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: 4.2.2; Build Notes: Intel Fortran Compiler 2020u4, Intel MPI 2020u4; threads/core: 1; Turbo: used; Build knobs:-ip -w -O3 -xCORE-AVX2 -vec-threshold0 -ftz -align array64byte -qno-opt-dynamic-align -fno-alias $(FORMAT_FREE) $(BYTESWAPIO) -fp-model fast=2 -fimf-use-svml=true -inline-max-size=12000 -inline-max-total-size=30000. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: 4.2.2; Build Notes: Intel Fortran Compiler 2020u4, Intel MPI 2020u4; threads/core: 1; Turbo: used; Build knobs: -ip -w -O3 -march=core-avx2 -ftz -align all -fno-alias $(FORMAT_FREE) $(BYTESWAPIO) -fp-model fast=2 -inline-max-size=12000 -inline-max-total-size=30000, getestet von Intel, Ergebnisse Stand April 2021. Binomialmodell: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: v1.0; Build notes: Tools: Intel C Compiler 2020u4, Intel Threading Building Blocks; Threads/Kerne: 2; Turbo: used; Build knobs: -O3 -xCORE-AVX512 -qopt-zmm-usage=high -fimf-domain-exclusion=31 -fimf-accuracy-bits=11 -no-prec-div -no-prec-sqrt. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: v1.0; Build Notes: Tools: Intel C Compiler 2020u4, Intel Threading Building Blocks ; threads/core: 2; Turbo: used; Build knobs: -O3 -march=core-avx2 -fimf-domain-exclusion=31 -fimf-accuracy-bits=11 -no-prec-div -no-prec-sqrt, getestet von Intel, Ergebnisse Stand April 2021. Monte Carlo: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: v1.1; Build Notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel Threading Building Blocks 2020u4; threads/core: 1; Turbo: used; Build knobs: -O3 -xCORE-AVX512 -qopt-zmm-usage=high -fimf-precision=low -fimf-domain-exclusion=31 -no-prec-div -no-prec-sqrt. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: v1.1; Build Notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel Threading Building Blocks 2020u4; threads/core: 2; Turbo: used; Build knobs: -O3 -march=core-avx2 -fimf-precision=low -fimf-domain-exclusion=31 -no-prec-div -no-prec-sqrt, getestet von Intel, Ergebnisse Stand April 2021. Ansys Fluent Geomean of aircraft_wing_14m, aircraft_wing_2m, combustor_12m, combustor_16m, combustor_71m, exhaust_system_33m, fluidized_bed_2m, ice_2m, landing_gear_15m, oil_rig_7m, pump_2m, rotor_3m, sedan_4m: Platinum 8358: 1-node, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: 2021 R1; Build Notes: Ein Thread pro Kern; Multi-threading Enabled; Turbo Boost Enabled; Intel FORTRAN Compiler 19.5.0; Intel C/C++ Compiler 19.5.0; Intel Math Kernel Library 2020.0.0; Intel MPI Library 2019 Update 8. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: 2021 R1; Build Notes: Ein Thread pro Kern; Multi-threading Enabled; Turbo Boost Enabled; Intel FORTRAN Compiler 19.5.0; Intel C/C++ Compiler 19.5.0; Intel Math Kernel Library 2020.0.0; Intel MPI Library 2019 Update 8, getestet von Intel, Ergebnisse Stand April 2021. Ansys LS-DYNA Geomean of car2car-120ms, ODB_10M-30ms: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: R11; Build Notes: Tools: Intel Compiler 2019u5 (AVX512), Intel MPI 2019u9; Threads/Kern: 1; Turbo: used. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: R11; Build Notes: Tools: Intel Compiler 2019u5 (AMDAVX2), Intel MPI 2019u9; threads/core: 1; Turbo: used, getestet von Intel, Ergebnisse Stand April 2021. OpenFOAM 42M_cell_motorbike: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: v8; Build Notes: Tools: Intel FORTRAN Compiler 2020u4, Intel C Compiler 2020u4, Intel MPI 2019u8; Threads/Kern: 1; Turbo: used; Build knobs: -O3 -ip -xCORE-AVX512. EPYC 7543: 1-Knoten, 2-Sockelt AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: v8; Build Notes: Tools: Intel FORTRAN Compiler 2020u4, Intel C Compiler 2020u4, Intel MPI 2019u8; threads/core: 1; Turbo: used; Build knobs: -O3 -ip -march=core-avx2, getestet von Intel, Ergebnisse Stand April 2021. LAMMPS Geomean of Polyethylene, Stillinger-Weber, Tersoff, Water: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: v2020-10-29; Build Notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel Threading Building Blocks 2020u4, Intel MPI 2019u8; Threads/Kerne: 2; Turbo: used; Build knobs: -O3 -ip -xCORE-AVX512 -qopt-zmm-usage=high. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: v2020-10-29; Build Notes: Tools: Intel MKL 2020u4, Intel C Compiler 2020u4, Intel Threading Building Blocks 2020u4, Intel MPI 2019u8; Threads/Kerne: 2; Turbo: used; Build knobs: -O3 -ip -march=core-avx2, getestet von Intel, Ergebnisse Stand April 2021. NAMD Geomean of Apoa1, STMV: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: 2.15-Alpha1 (inklusive AVX Tiles Algorithmus); Build Notes: Tools: Intel MKL , Intel C Compiler 2020u4, Intel MPI 2019u8, Intel Threading Building Blocks 2020u4; threads/core: 2; Turbo: used; Build knobs: -ip -fp-model fast=2 -no-prec-div -qoverride-limits -qopenmp-simd -O3 -xCORE-AVX512 -qopt-zmm-usage=high. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: 2.15-Alpha1 (inklusive AVX Tiles Algorithmus); Build Notes: Tools: Intel MKL , AOCC 2.2.0, gcc 9.3.0, Intel MPI 2019u8; threads/core: 2; Turbo: used; Build knobs: -O3 -fomit-frame-pointer -march=znver1 -ffast-math, getestet von Intel, Ergebnisse Stand April 2021. RELION Plasmodium Ribosome: Platinum 8358: 1-Knoten, 2x Intel® Xeon® Platinum 8358 (32 K/2,6 GHz, 250 W TDP) Prozessor auf Intel Software Development Plattform mit insgesamt 256 GB (16 Steckplätze/ 16 GB/ 3200) DDR4 Arbeitsspeicher, ucode 0x261, HT an, Turbo an, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_3.crt1.x86_64, 1x Intel_SSDSC2KG96, App Version: 3_1_1; Build notes: Tools: Intel C Compiler 2020u4, Intel MPI 2019u9; Threads/Kerne: 2; Turbo: used; Build knobs: -O3 -ip -g -debug inline-debug-info -xCOMMON-AVX512 -qopt-report=5 –restrict. EPYC 7543: 1-Knoten, 2-Sockel AMD EPYC 7543 (32 K/2,8 GHz, 240 W cTDP) auf Dell PowerEdge R7525 Server mit insgesamt 1024 GB (16 Steckplätze/ 64 GB/3200) DDR4 Arbeitsspeicher, ucode 0xa001119, SMT on, Boost on, Power deterministic mode, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, App Version: 3_1_1; Build notes: Tools: Intel C Compiler 2020u4, Intel MPI 2019u9; threads/core: 2; Turbo: used; Build knobs: -O3 -ip -g -debug inline-debug-info -march=core-avx2 -qopt-report=5 -restrict, getestet von Intel, Ergebnisse Stand April 2021.
Höchste verfügbare Speicherbandbreite in einer HPC-CPU (9200) mit 12 DDR4 Kanälen für speicherintensive Workloads. Seit dem 21. Juli 2021 bietet Intel bis zu 12 DDR4-Speicherkanäle für Intel® Xeon® Prozessoren im Vergleich zu 8 für AMD EPYC.
11X höhere Batch-KI-Inferenzleistung mit Intel-optimierter TensorFlow im Vergleich zur Cascade Lake FP32 Standard-Konfiguration Neu: 8380: 1-Knoten, 2x Intel Xeon Platinum 8380 Prozessor auf Coyote Pass mit insgesamt 512 GB (16 Steckplätze/32 GB/3200) DDR4-Speicher, ucode X261, HT aktiviert, Turbo aktiviert, Ubuntu 20.04 LTS, 5.4.0-65-generic, 1x Intel_SSDSC2KG96, Intel SSDPE2KX010T8, ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32, INT8, TensorFlow 2.4.1 mit Intel Optimierungen für den skalierbaren Intel Xeon Prozessor der 3. Generation, hochgestuft auf TensorFlow-2.5 (container-intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Modell Zoo: https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, Unoptimiertes Modell: TensorFlow-2.4.1, Modell Zoo: https://github.com/IntelAI/models -b Master, Test von Intel am 12.03.2021. Baseline: 8280: 1-Knoten, 2x Intel Xeon Platinum 8280 Prozessor auf Wolf Pass mit insgesamt 384 GB (12 Steckplätze/32 GB/2933) DDR4-Speicher, ucode 0x5003003, HT aktiviert, Turbo aktiviert, Ubuntu 20.04 LTS, 5.4.0-48-generic, 1x Samsung_SSD_860, Intel SSDPE2KX040T8, ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32, INT8, Optimiertes Modell: TensorFlow 2.4.1 mit Intel Optimierungen für skalierbare Intel Xeon Prozessoren der 3. Generation, hochgestuft auf TensorFlow-2.5 (container- intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Modell Zoo: https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, Unoptimiertes Modell: TensorFlow-2.4.1, Model Zoo: https://github.com/IntelAI/models -b master, getestet von Intel am 17.02.2021.