Von der Wettervorhersage, über die Kartierung der menschlichen Genome und die Heilung der tödlichsten Krankheiten der Welt bis hin zu der Gestaltung energieeffizienterer Materialien berührt High-Performance Computing (HPC) jeden Teil unseres Lebens. Fortschritte bei HPC und KI fördern die Wettbewerbsfähigkeit und lassen die Nachfrage nach wissenschaftlichen Berechnungen in neue Höhen steigen, aber es gibt keine Einheitslösung. Es gibt eine unglaubliche Vielfalt in der traditionellen HPC-Software und wenn Sie sich häufige Arbeitslasten nach vertikalen und charakteristischen Merkmalen ansehen, sind einige speichergebunden. Andere sind rechenintensiv. Manche haben kleine Kerne mit viel Kontrollfluss. Andere haben große, datenparallele Kernel. Die meisten beinhalten extrem große Datensätze.
Die Intel® Xeon® CPU Max Reihe erweitert die skalierbaren Intel® Xeon® Prozessoren um Speicher mit hoher Bandbreite (HBM) und wurde entwickelt, um Leistung und Geschwindigkeit von Entdeckungen in datenintensiven Workloads wie Modellierung, KI und Deep Learning sowie High Performance Computing (HPC) und Datenanalyse freizuschalten.
Maximieren Sie Leistung mit verbesserter Bandbreite
Die Intel Xeon CPU Max Reihe verfügt über eine Mikroarchitektur und unterstützt eine Reihe an Plattformverbesserungen, einschließlich einer höheren Anzahl von Kernen, fortschrittlichen E/A- und Speicher-Subsystemen sowie integrierten Beschleunigern, die die Bereitstellung lebensverändernder Entdeckungen beschleunigen. Intel Max Reihe CPUs Merkmal:
- Bis zu 56 Leistungskerne, die aus vier Tiles aufgebaut und mit der Embedded Multi-die Interconnect Bridge (EMIB) Technik von Intel verbunden sind, in einem 350-Watt-Raum.
- 64 GB an Speicher mit hoher Bandbreite im Arbeitsspeicher sowie PCI Express 5.0 und CXL 1.1 I/O. Xeon Max CPUs wird Arbeitsspeicher (HBM) Kapazität pro Kern bieten, und genug, um die meisten gängigen HPC-Workloads zu erfüllen.
5-mal
bessere Leistung
für Speicherbandbreite im Vergleich zu Konkurrenz und früheren Generationen1
2S Intel Xeon CPU vs. 2S AMD EPYC 7773X
2S Intel® Xeon® 8380 der 3. Generation
- Bis zu 20-fache Leistungsbeschleunigung auf Numenta KI-Technologie für die Verarbeitung von natürlichen Sprachen (NLP) mit HBM im Vergleich zu anderen CPUs.2
Beschleunigung von wissenschaftlicher Innovation
Ermöglichen Sie schnelle Entdeckungen und eine effektivere Forschung. Mit der Intel Xeon CPU Max Reihe und den skalierbaren Intel Xeon CPU Prozessoren der 4. Generation erhalten Sie Leistung und Energieeffizienz für die anspruchsvollsten Workloads und die meisten integrierten Beschleuniger jeder CPU auf dem Markt. Erreichen Sie mehr effiziente CPU-Auslastung, geringeren Stromverbrauch und und höheren ROI mit wichtigen Beschleunigern für HPC KI Workloads, einschließlich:
- Intel Advanced Matrix Extensions (Intel AMX) – erhebliche Beschleunigung von Deep-Learning-Inferenz und Schulung auf der CPU mit Intel® AMX, was die KI-Leistung verbessert und 8x Spitzendurchsatz über AVX-512 für INT8 mit INT32 Akkumulationsoperation liefert.3
- Intel Streaming Beschleuniger (Intel DSA) – Steigern Sie dei Leistung für datenintensive Workloads durch Verbesserung der Streaming-Datenbewegung. Mit Intel® DSSA erreichen Sie bis zu 79 % höheren Speicher I/O pro Sekunde (IOPS) mit bis zu 45 % niedrigerer Latenz bei der Verwendung von NVMe über TCP.4
- Intel Advanced Vector Extensions 512 (Intel AVX-512) – Beschleunigung der Leistung mit Vektorisierung, um zu schnelleren Berechnungen für größere Datensätze für wissenschaftliche Simulationen, KI / Deep Learning, 3D Modellierung und Analyse und anderen intensiven Workloads beizutragen. Intel® AVX-512 ist der neueste x86 Vektor-Befehlssatz zur Beschleunigung der Leistung für Ihre anspruchsvollsten Rechenaufgaben.
- I/O und Arbeitsspeicher-Subsystem-Erweiterungen, einschließlich:
- DDR5—Verbesserung der Rechenleistung durch Überwindung von Datenengpässen mit höhere Speicherbandbreite. DDR5 bietet bis zu 1,5-fache Bandbreite Verbesserung gegenüber DDR4.
- PCI Express Gen 5 PCIe 5.0—Freischaltung neuer I/O-Geschwindigkeiten mit Möglichkeiten, den höchstmöglichen Durchsatz zwischen CPU und Geräten zu aktivieren. Die skalierbaren Intel Xeon Prozessoren der 4. Generation und Intel Xeon Prozessoren der Max Reihe, haben bis zu 80 Lan PCIe 5.0, doppelt so hoch wie die I/O-Bandbreite von PCIe 4.0.
- Compute Express Link (CXL) 1.1—Verstärkung für die Bandbreite mit hoher Stoffqualität und der Effizienz des angeschlossenen Beschleunigers.
- Einfache Integration auf Intel Xeon—Leichtes Hinzufügen der CPUs der Max Reihe zu skalierbaren Intel Xeon Plattformen der 4. Generation, indem die gleiche Socket-Konfiguration genutzt wird, was zu keiner Codeänderung bei den meisten Bereitstellungen führt.
Flexibilität für alle Ihre HPC und KI Workloads
Die CPUs der Intel Max Reihe verfügen über die Flexibilität, in verschiedenen Speichermodi bzw. Konfigurationen zu laufen, je nach den Merkmalen des Workloads:
- HBM-Only Modus – Der HBM-Only-Modus ermöglicht Workloads, die in 64 GB Kapazität passen und die Fähigkeit, mit 1-2 GB Arbeitsspeicher pro Kern zu skalieren. Er unterstützt Systemstarts ohne Codeänderungen und ohne DDR.
- HBM Flat Modus—Der HBM Flat Modus bietet Flexibilität für Anwendungen, die Arbeitsspeicher benötigen, bietet einen Speicher mit HBM und DRAM und kann auf Workloads angewendet werden, die mehr als 2 GB Speicher pro Kern benötigen. Code-Änderungen können erforderlich sein.
- HBM Cache-Modus – Konzipiert, um Leistung für Workloads über 64 GB Kapazität zu verbessern oder über 2 GB Arbeitsspeicher pro Kern benötigen. Keine Code-Änderungen erforderlich und HBM Caches DDR.
Intel® Xeon® CPU Max Reihe | |
---|---|
Kernanzahl | 32-56 |
HBM2E Speicher | 64 GB |
Peak HBM Übertragungsrate | 3200 MT/s |
Peak DDR5 Übertragungsrate | 4800 MT/s (1 DPC) 4400 MT/s (2 DPC) |
Beschleuniger | AMX, 4 DSA Geräte |
AI/ML Befehle | INT8 und BFLOAT16 |
Beschleunigung von HPC und AI Workloads über mehrere Architekturen
Die gesamte Intel Max Produktreihe wird durch oneAPI für ein gemeinsames, offenes, standardbasiertes Modell vereinheitlicht, das Produktivität und Leistung freisetzt. Mit dem Intel oneAPI Base Toolkit und den oneAPI HPC plus domänenspezifischen Toolkits können Entwickler allgemeine Compute, HPC und AI KI Anwendungen über mehrere Arten von Architekturen erstellen, analysieren, optimieren und über verschiedene Architekturen skalieren. Diese Ressourcen umfassen hochmoderne Techniken wie Vektorisierung, Multithreading, Multi-Node-Parallelität und Arbeitsspeicheroptimierung, damit Sie mühelos leistungsstarke Software mit mehreren Architekturen erstellen können, die für HPC geeignet ist. Um die neuesten Entwicklertools für HPC-Software kennenzulernen, besuchen Sie die Ressourcenseiten Software für Intel Xeon Prozessoren der 4. Generation und Prozessoren der Intel Xeon CPU Max Produktreihe und HPC-Software und -Tools.