DAOS-Speicherlösung revolutioniert Hochleistungsspeicher

Distributed Asynchronous Object Storage (DAOS) bietet mit persistentem Intel® Optane™ Speichermedium erhebliche Verbesserungen beim Datenspeicher-I/O zur beschleunigten Durchführung von HPC-, KI-, Analyse- und Cloud-Projekten.

DAOS

  • Herkömmliche Speicher nutzen bei der Verarbeitung von Anfragen aus mehreren Rechenknoten die Sperrung von Metadaten in I/O-Blöcken. DAOS speichert Metadaten byteweise in persistentem Intel® Optane™ Speicher und eliminiert so die Latenz aus dem Sperren von I/O-Blöcken.

  • In Kombination mit NVMe-SSDs kann DAOS das volle Potenzial der Direktverbindungsgeschwindigkeiten von PCIe mit Datenspeicher-I/O im Mikrosekundenbereich nutzen.

  • DAOS weitet die HPC-Grenzen im Exascale-Bereich noch weiter aus und verzeichnet einige der bestplatzierten Konfigurationen in der IO-500-Auflistung.

  • Außerdem mindern persistente Speicher die Leistungsbeeinträchtigungen aufgrund von Schreibdruck in DAOS mit NAND-Datenspeichern der unteren Preisklasse.

  • Skalierbare Intel® Xeon® Prozessoren in Speicherclustern können die DAOS-Leistung mit mehr Speicherkanälen und PCIe-Bandbreite verbessern.

author-image

DAOS-Speicherlösung revolutioniert Hochleistungsspeicher

Distributed Asynchronous Object Storage (DAOS) bietet mit persistentem Intel® Optane™ Speichermedium erhebliche Verbesserungen beim Datenspeicher-I/O zur beschleunigten Durchführung von HPC-, KI-, Analyse- und Cloud-Projekten.

Setzen Sie Hochleistungsspeicher mit DAOS in die Tat um

DAOS ist eine Open-Source-Lösung für verteilte Datenspeicher auf der Grundlage zahlreicher innovativer Prinzipien. Diese Technik nutzt die schnelle I/O und Datenpersistenz von persistentem Intel® Optane™ Speicher in Kombination mit beliebigen NVMe-SSDs (Non-Volatile Memory Express) wie etwa Intel® NVMe-SSDs, um in verteilten Umgebungen Engpässe zu reduzieren und die Speicherleistung zu steigern.

Latenz bei herkömmlichen Speichern

Bei herkömmlichen Speicherlösungen informieren Metadaten das Betriebssystem darüber, wo sich innerhalb eines Speicher-Clusters Daten befinden. Jedes Mal, wenn das System für Lese- oder Schreibvorgänge auf Daten zugreift, muss es auch innerhalb eines I/O-Blocks im zugrunde liegenden Speichermedium entsprechende Metadaten erstellen oder ändern. In Rechen-Clustern müssen mehrere Knoten mitunter auf denselben Block zugreifen, sodass bei herkömmlichen Speicherlösungen vorübergehend der Block gesperrt wird, um Schreibkonflikte zu verhindern. Wenn dies bei Millionen von Lese-/Schreibvorgängen auftritt, entsteht eine erhebliche Speicherlatenz, die die Anwendungs-I/O beeinträchtigt.

Schreiblatenzen im Mikrosekundenbereich mit DAOS, persistentem Intel® Optane™ Speicher und Intel® NVMe-SSDs

In einer DAOS-Konfiguration speichern persistente Intel® Optane™ Speichermodule Metadaten für den gesamten Cluster byte- statt blockweise, sodass der Block nicht wie bei herkömmlichen Speichern gesperrt zu werden braucht. Der Einsatz von NVMe-SSDs ermöglicht darüber hinaus die Sättigung des PCIe-Busses durch Datenspeicher-I/Os mit einer größeren Pipeline im Vergleich zu SATA-SSDs.1 Infolgedessen kann DAOS erheblich schnellere Datenspeicher-I/O als bei herkömmlichen Datenspeichern in einer Größenordnung von Millisekunden bis zu mehreren Mikrosekunden gewährleisten.2 Persistenter Speicher behält Metadaten auch bei Systemabschaltungen und Neustarts bei und kann kleine Schreibvorgänge absorbieren, um die Systemverfügbarkeit bei strikten SLA-Anforderungen zu gewährleisten. In DAOS-Bereistellungen mit 3D QLC NAND-Speichern kann persistenter Speicher außerdem die Leistungsbeeinträchtigung von Schreibdruck auf dem Speichercluster mindern.

Abbildung 1: DAOS Software- und Hardware-Stack

Open-Source-Software und validierte DAOS-Versionen

Neben der Hardware-Ebene benötigen Lösungsanbieter Open-Source-DAOS-Software zur Vollendung des Stacks. Entwickler können den Code direkt von GitHub herunterladen und kompilieren. Für einen einfacheren Bereitstellungspfad sind getestete und validierte Binärversionen über die Community-Website daos.io verfügbar. Intel arbeitet aktiv mit Partnern und Lösungsanbietern zusammen, um ihre DAOS-Produktangebote mit technischem L3-Support auszustatten.

Auf neuesten Code auf GitHub zugreifen
Validierte Binärversionen von daos.io herunterladen
DAOS-Dokumentation auf daos.io konsultieren
DAOS-E-Mail-Verteiler für die neuesten Aktualisierungen aus der Community beitreten

HPC und Big Data: DAOS-Speicher ändern die Zukunft

In Big Data- und HPC-Clustern sind Rechenknoten eng mit Speicherebenen verbunden, und Datenwissenschaftler haben es häufig mit einer Vielzahl von kalten, warmen und heißen Datentypen zu tun. Speicherkonfigurationen der Zukunft werden von einem hybriden Ansatz abhängen, bei dem DAOS an Dateisysteme angehängt ist, die außerdem kostenoptimierte SATA-Laufwerke verwenden. Akademische und staatliche Labors sehen bereits die Ergebnisse der hohen Rechenkapazitäten in HPC-Clustern, die ihre Tätigkeiten erheblich beschleunigen. 

So hat beispielsweise das Radiologieforschungszentrum der Washington University ein softwaredefiniertes Speichersystem bereitgestellt, das mithilfe von DAOS bis zu 13 Petabyte Speicherplatz zu um 1500 USD niedrigeren Kosten pro Speicherknoten bietet.3 Auch kommerzielle HPC-Bereitstellungen weisen erhebliches Potenzial auf, insbesondere in den Bereichen Energie und Gesundheitswesen, die einen hohen Bedarf an HPC-KI, Analysen und Simulations-Workloads aufweisen. Im IO-500 Benchmark, einer Auflistung der weltweit schnellsten Speichersysteme, nehmen DAOS-Konfigurationen derzeit die Hälfte der zehn besten Plätze ein.4

DAOS-Speicher für hohe Leistung im Exascale-Bereich

DAOS dient als Datensystem für den Aurora-Supercomputer des Argonne National Lab (ANL), das erste geplante HPC-System mit Exascale-Rechenleistung, das mit bis zu 230 Petabyte von DAOS-fähigem Datenspeicher und einer Lese-/Schreibbandbreite von über 25 TB/s aufwarten kann. Sowohl das ANL als auch das Texas Advanced Computing Center (TACC), ein weiterer Partner von Intel mit DAOS-fähigem HPC, rangierten im September 2020 unter den ersten fünf Positionen der IO-500-Auflistung. Diese Erfolge haben auch das Interesse von CSPs wie Google Cloud Platform geweckt, denen nunmehr sehr daran gelegen ist, DAOS in ihre Cloud-Speicherdienste aufzunehmen.

Niedrige Leselatenzen selbst bei Schreibdruck

Selbst für kostenoptimierte Medien mit leseintensiven Workloads kann DAOS eine positive Wirkung haben. Eine mit Intel® QLC 3D NAND-SSDs anstelle von NVMe-SSDs getestete DAOS-Konfiguration konnte Latenzen bei gelesenen Endbits in einer Größenordnung von fünf Neunen (P99.999) zwischen 200 und 300 μs erzielen, was bedeutet, dass 99,999 Prozent aller Anforderungen in weniger als 300 μs übertragen wurden.5 Bei Anwesenheit von Schreibdruck von bis zu 2.500 MB/s zeigte der gleiche Test, dass DAOS fünf Dateisystem-SLAs einhalten und fünf Neunen in weniger als 5 ms erzielen konnte.5

Skalierbare Intel® Xeon® Prozessoren und DAOS-Leistung

Prozessorleistung in einem Datenspeicher wirkt sich positiv auf die DAOS-Leistung aus. Allmähliche Verbesserungen hinsichtlich der Anzahl der Speicherkanäle, der Bandbreite pro Kanal sowie der PCIe-Geschwindigkeit (PCIe 4 gegenüber PCIe 3) stellen einen erheblichen Schub nach vorn für DAOS dar. In einem IOR Benchmark-Test erzielte eine Konfiguration aus skalierbaren Intel® Xeon® Prozessoren der 3. Generation und persistenten Intel® Optane™ Speichern der Produktreihe 200 eine Steigerung bei der Schreibleistung um 58 Prozent im Vergleich zu CPUs und persistenten Speichern älterer Generationen.6 Es wird erwartet, dass PCIe Gen 5 in zukünftigen Prozessorgenerationen noch höhere Leistungsniveaus für DAOS bieten wird.

DAOS-Schlussfolgerung: eine neuer Weg für Datenspeicher-I/O

DAOS eröffnet einen neuen Weg zur Umsetzung von hervorragendem Datenspeicher-I/O, der mit der steigenden Rechenleistung Schritt hält und selbst bei anspruchsvollsten Anwendungsfällen noch Datenspeicher-I/O für andere Zwecke bereithält. Anwendungen für KI, Analysen, HPC und sogar Cloud-Computing können von DAOS mit persistenten Intel® Optane™ Speichern profitieren.

FAQs

Häufig gestellte Fragen

Distributed Asynchronous Object Storage (DAOS) ist eine Open-Source-Lösung für verteilte Datenspeicher, die persistenten Intel® Optane™ Speicher für den Zugriff auf und den Abruf von Metadaten nutzt und in Kombination mit NVMe-SSDs für äußerst hohe Lese-/Schreibgeschwindigkeiten sorgt.

Herkömmliche verteilte Datenspeicher speichern Metadaten in I/A-Blöcken auf dem zugrunde liegenden Medium und unterbinden Änderungen an solchen Blöcken, wenn ein Rechenknoten einen Vorgang durchführt, bei dem Metadaten erstellt, aktualisiert oder gelöscht werden. In einer DAOS-Konfiguration werden Metadaten Byte für Byte auf persistenten Intel® Optane™ Speichermodulen gespeichert. DAOS-Speichercluster kommen ohne die Sperrung von I/O-Blöcken aus, wodurch die Datenspeicher-I/O-Latenz erheblich abnimmt.

Ja, Sie können POSIX mit DAOS verwenden. DAOS verwendet POSIX zwar nicht intern, aber wir bieten eine POSIX-Schnittstelle sowie Schnittstellen für Schlüsselwert, HDF5, MPI-IO, Python und anderes mehr. Weitere Informationen zu den Vor- und Nachteilen verschiedener DAOS-Schnittstellen finden Sie in der Dokumentation auf daos.io.

Die Leistungseigenschaften variieren je nach Verwendung, Konfiguration und anderen Faktoren. Weitere Informationen finden Sie unter intel.com/PerformanceIndex.

Die Leistungswerte basieren auf Tests, die mit den in den Konfigurationen angegebenen Daten durchgeführt wurden und spiegeln möglicherweise nicht alle öffentlich verfügbaren Updates wider. Einzelheiten zur Konfiguration siehe Backup. Kein Produkt und keine Komponente bieten absolute Sicherheit.

Produkt- und Leistungsinformationen

1Konfigurationen: Leistungsverbesserungen aus Datenblatt, sequentielle Lese-/Schreibraten bei Blockgröße von 128K für NVMe und SATA, 64K für SAS. Intel® SSD der Produktreihe DC P3700 mit 2 TB, SAS Ultrastar SSD1600MM, Intel® SSD der Produktreihe DC S3700, SATA, 6 Gbit/s. Intel® Core™ i7-3770K CPU mit 3,50 GHz, 8 GB Systemspeicher, Windows Server 2012, IOMeter. Leistung bei wahlfreiem Zugriff wird erfasst mit vier Workers, jeweils mit Queue-Tiefe 32.
2Achieve High-Performance Storage with DAOS“, intel.com, Juni 2021.
3„Washington University: Deploying High-Speed Storage with Intel® Technologies“, intel.com, Oktober 2021.
4IO500.org zum Zeitpunkt Oktober 2021
5Achieve High-Performance Storage with DAOS“, intel.com, Juni 2021.
6Am 15. Oktober 2020 von Intel® durchgeführter Test. Ausgangskonfiguration: Plattform: S2600WFO, 1 Knoten mit 2x8260L skalierbaren Platinum Intel® Xeon® CPUs der 2. Generation, Microcode 0x400002c, HT und Turbo on, Leistungsmodus, System-BIOS SE5C620.86B.02.01.0008.031920191559, PMem Firmware 01.00.00.5127, System-DRAM-Konfiguration 12 Slots / 16 GB / 2666 (192 GB Gesamtspeicher), System-PMem-Konfiguration 12 Slots / 512 GB / 2666 (6 TB Gesamtspeicher), 1x Intel® SATA SSD, 2x Intel® OPA100 NIC, PCH Intel® C621, OS openSUSE Leap 15.2, Kernel 5.3.18-lp152.44-default, Workload DAOS 1.1.0. Neue Konfiguration: Plattform: WLYDCRB1, 1 Knoten mit 2x ICX-24C skalierbaren Intel® Xeon® CPUs der 3. Generation (Ice Lake Pre-Production), Microcode 0x8b000260, HT und Turbo on, Leistungsmodus, System-BIOS WLYDCRB1.SYS.0017.D75.2007020055, PMem Firmware 02.01.00.1110, System-DRAM-Konfiguration 16 Slots / 16 GB / 3200 bei 2933 (256 GB Gesamtspeicher), System-PMem-Konfiguration 16 Slots / 512 GB / 2933 (8 TB Gesamt-PMem), 1x Intel® SATA SSD, 2x Intel® OPA100 NIC, PCH Intel® C621, OS openSUSE Leap 15.2, Kernel 5.3.18-lp152.44-default, Workload DAOS 1.1.0.