Alibaba Cloud: POLARDB*, eine in der Cloud gehostete Datenbank

Software-definierter Speicher, der mit Intel® Optane™ SSDs für Rechenzentren betrieben wird, verbessert die Leistung und reduziert die Latenz.

Auf einen Blick:

  • Die Alibaba Cloud ist das größte E-Commerce-Business in China und ein schnell wachsender Cloud-Service-Anbieter.

  • Die Grundlage für POLARDB* bildet eine verteilte gemeinsame Speicher-Systemarchitektur. Diese wurde entwickelt, um Intel® Optane™ Solid-State-Laufwerke (SSDs) und Intel® 3D-NAND-SSDs zu verwenden. Intel® SSDs helfen auch dabei, die Kosten und die Leistung zu überwachen.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Relationale Datenbankmanagementsysteme (RDBMS) bilden die Grundlage von Unternehmen weltweit. Außerdem sind sie eine Grundvoraussetzung für Unternehmensaktivitäten und digitale Transformation.

Ein lokales RDBMS kann jedoch erhebliche Investitionen in Infrastruktur, Zeit, Kosten und Personal benötigen, um es auf dem aktuellen Stand zu halten, so dass geschäftliches Wachstum erreicht werden kann, und sicherzustellen, dass es digitale Transformation unterstützen kann. Eine Lösung für dieses Problem ist Cloud-Computing, das sich zu einer Mainstream-Technologie entwickelt hat und von Organisationen aller Größen verwendet wird.

Relationale Datenbanken sind weit verbreitet als Cloud-hosted Services, sogenannte Database-as-a-Service (DBaaS) Lösungen. Ein Cloud-basiertes RDBMS kann jedoch eigene Schwachstellen aufweisen, welche die Notwendigkeit für Cloud-hosted relationale Datenbanklösungen für die digitale Transformation deutlich machen. Beliebte Datenbanken sind MySQL* und Oracle Database*; wenn Sie jedoch lokal gehostet oder als Service in der Cloud verwaltet werden, kann es schwierig werden, diese zu sichern, verwalten und skalieren, und sie können die benötigte Leistung oder Dienstgüte (QoS) nicht erbringen.

Alibaba Cloud hat eine innovative, handelsübliche, Cloud-hosted relationale Datenbank namens POLARDB* entwickelt, die diese Probleme angeht und Unternehmen ein neues DBaaS-Modell bietet. Die Grundlage für POLARDB bildet eine Architektur des verteilten gemeinsamen Speichers. Diese wurde entwickelt, um Intel® Optane™ Solid-State-Laufwerke (SSDs) und Intel® 3D-NAND-SSDs zu verwenden.

Klassische Herausforderungen von Cloud-hosted Datenbanken
In einer öffentlichen Cloud-Umgebung kann eine wachsende Zahl der Benutzer, Benutzerdienste und Datenmengen zu Problemen mit Backups, Leistung, Migration, Upgrades, Kapazität und Verzögerungen führen, die durch das Binärlog verursacht werden. Der Zeitaufwand, um Daten zu skalieren, sichern und migrieren, nimmt mit wachsendem Datenvolumen zu. Es kann Stunden oder sogar Tage dauern, um Datenmengen im Terabyte-Bereich zu sichern. Die Upgrades, Skalierung, Sicherung und Datenmigration können dazu führen, dass eine Datenbank offline genommen und neu gestartet wird, was sich auf die Unternehmen, ihre Nutzer und ihr IT-Personal auswirken kann. Die Migration von Daten kann zu einer verlangsamten Leistung unternehmenskritscher Anwendungen führen. Das Aufrechterhalten des täglichen Geschäftsbetriebs kann erhebliche CPU-Ressourcen erfordern, welche zu Verzögerungen und einem geringerem Preis-Leistungs-Verhältnis führen, wenn mehrere Millionen Transaktionen in Betracht gezogen werden.

Intel Optane SSDs erhöhen die Abfragen pro Sekunde (QPS) um 30 % für ein verbessertes Kundenerlebnis mit POLARDB1; 76 % Verbesserung des 95. Perzentil-Latenzwertes mit POLARDB1; und 100 TB Kapazität pro POLARDB Datenbankinstanz.

POLARDB definiert das Hosting einer Datenbank in der Cloud neu
POLARDB geht neue Wege basierend auf dem bestehenden DBaaS-Modell. Es nutzt ein innovatives Software-definiertes Scale-out-System, welches schnelle, niedrige Latenz von Intel Optane SSDs und preiswerte hochleistungsstarke Intel 3D NAND SSDs vereint. Unternehmen mit großen, wachsenden Datenmengen, die eine durchgängig niedrige Latenz, hohen Durchsatz und hohe QoS in Kombination mit einem guten Preis-Leistungs-Verhältnis benötigen, können von POLARDB profitieren.

Das Speichermodell von POLARDB bietet, zusammen mit anderen Innovationen, die Leistung und Verfügbarkeit einer handelsüblichen Datenbank in einem DBaaS-Modell. Alibaba Cloud entwickelte POLARDB mit dem Fokus auf Cloud-Kosten, Leistung zur Verarbeitung von Online-Transaktionen (OLTP), Geschäftskontinuität, Geschäftswachstum und Sicherheit für Unternehmenskunden. Die gesamte Hard- und Software werden entwickelt, um effektiv zusammenzuarbeiten, einschließlich der zugrunde liegenden Intel Hardware, in einem Cloud-nativen Design, das für hohe Zuverlässigkeit und hohe Verfügbarkeit konzipiert wurde. Die Architektur bietet hohe Leistung und kostet etwa ein Zehntel einer traditionellen, lokalen relationalen Datenbank.2

Die Architektur von POLARDB ermöglicht die Bereitstellung eines bis zu 6-fach höheren Durchsatzes als dem eines normalen MySQL 5.6 und 5.7, wenn MySQL auf NAND-basierten Peripheral Component Interconnect Express* (PCIe*) und NVM Express* (NVMe*) SSDs ausgeführt wird. POLARDB liefert den Durchsatz von bis zu einer Million Ein-/Ausgabeoperationen pro Sekunde (IOPS) mit einer Latenz von Millisekunden 2 POLARDB kann auch auf Abruf innerhalb von weniger als 10 Minuten hoch- oder runterskalieren. Es unterstützt eine Kapazität von bis zu 100 TB pro Datenbankinstanz im Vergleich zu nur 64 TB bei ähnlichen Lösungen. Speicherkapazität und Klone können automatisch skaliert werden. Und POLARDB ist zu 100 Prozent abwärtskompatibel mit MySQL 5.6 und 5.7.

Intel Optane SSDs Optimieren der Speicherleistung
Das verteilte Speicherdesign mit Intel Optane SSDs und Intel 3D NAND SSDs bei POLARDB bietet hervorragende Speichereffizienz, hohe QoS, hohe IOPS, hohen Durchsatz und zuverlässige Leistung. Intel® SSDs helfen auch dabei, die Kosten und die Leistung zu überwachen. Intel Optane SSDs unterstützen die Alibaba Cloud bei der Beseitigung von Datenspeicherengpässen, bieten größere, kostengünstigere Datensätze, beschleunigen Anwendungen, reduzieren Transaktionskosten für latenzempfindliche Workloads und verbessern die Gesamtbetriebskosten der Rechenzentren (TCO) für POLARDB.

Durch die Kombination von rasend schnellen, hochleistungsstarken Intel Optane SSDs mit durchsatzstarken Intel 3D NAND SSDs in der Softwareschicht implementiert POLARDB eine hybride Datenspeicherebene, die gleichbleibend geringe Latenz, hohen Durchsatz, hohe QoS und ein insgesamt geringeres Preis-Leistungs-Verhältnis bietet als bei der alleinigen Verwendung von Intel 3D NAND SSDs für die Speicherebene.

Mit Intel Optane SSDs und Intel 3D NAND SSDs hat Alibaba Cloud Folgendes realisiert:

  • Erhöhung der Abfragen pro Sekunde (QPS) um 30 % für ein verbessertes Kundenerlebnis mit POLARDB1
  • Verbesserung des 95. Perzentil-Latenzwertes um 76 % mit POLARDB1

Die POLARDB-Architektur
Die Software-definierte Architektur der POLARDB nutzt verteilten Speicher, das Storage-Performance-Development-Kit (SPDK), Remote Direct Memory Access (RDMA) und andere Innovationen, um eine leistungsstarke, skalierbare und Cloud-basierte Datenbank zu erschaffen. Die POLARDB-Architektur trennt die Rechen- und Speicherpools. Wenn CPU-Ressourcen und Arbeitsspeicher nicht ausreichen, wird der Pool für die Rechenressourcen getrennt vom Speicherpool erweitert; und wenn die Kapazität oder IOPS gering ist, skaliert der Pool für die Speicherressourcen unabhängig vom Rechenpool.

Die verteilte Speicherarchitektur der POLARDB nutzt drei Repliken oder Knoten anstelle eines lokalen Speichers. Eine Replik wird zum Lesen und Schreiben verwendet, die beiden anderen ausschließlich zum Lesen. Wenn eine neue Lese-Instanz benötigt wird, müssen keine Daten kopiert werden; unabhängig davon, wie groß das neue Datenvolumen ist, kann es innerhalb von fünf Minuten abgeschlossen werden, während es bis zu 70 Stunden dauern kann, um eine Instanz für eine traditionelle Datenbank mit mehr als 3 TB Daten hinzuzufügen.1 Die primäre Instanz und die Lese-Instanz benutzen dieselben Datenspeicherressourcen, wodurch die Kopierleistung für die Anzeigen ohne zusätzliche Kosten für neue Speicherplatz erhöht wird. Die Nutzer zahlen nur für CPU-und Arbeitsspeicher, die durch die Lese-Instanzen verbraucht werden. POLARDB nutzt diese verteilte Speicherkonfiguration, um Daten zu lokalisieren und schneller zu skalieren als eine traditionelle Datenbank.

Abbildung 1. Die Architektur der Alibaba Cloud POLARDB* mit Intel® SSDs.

Jeder POLARDB-Speicherknoten nutzt ein Intel® Optane™ SSD Laufwerk der Produktreihe DC P4800X für schnelles Journaling und Indexieren und unterstützt die Intel SSD Laufwerke der Produktreihe DC P4500, die für die Datenspeicherung verwendet werden. Das SPDK schreibt Daten auf die NVMe-Schnittstelle jedes der Intel 3D NAND SSDs ohne auf den synchronisierten Arbeitsspeicher zugreifen zu müssen. Vor der Implementierung von Intel Optane SSDs wurden Journaling und Daten auf NVMe-basierten Intel SSDs für das Rechenzentrum zusammengelegt, was den Zugriff auf den synchronisierten Arbeitsspeicher erforderlich machte. Durch das Umgehen des synchronisierten Speicher kann POLARDB die Leistung erhöhen und die Latenz reduzieren.

Weitere Leistungsvorteile mit POLARDB resultieren aus:

  • Verwendung des RDMA over Converged Ethernet (RoCE) Netzwerkprotokolls zur Verringerung der Latenz und der CPU-Auslastung sowie zur Erhöhung der Bandweite
  • Umgehung des Linux*-Kerns mit einem Software-definierten Stack, wodurch POLARDB im Benutzermodus ausgeführt wird und somit Overhead verringert werden kann
  • Kein Binärlog nötig, wodurch Transaktionszeiten und der Aufwand für Input/Output (I/O) reduziert werden

Zugriff auf eine handelsübliche Database as a Service
Durch die Implementierung einer DBaaS braucht das IT-Team eines Unternehmens keine Datenbanken im eigenen Haus mehr verwalten und auch keine Hardware mehr anschaffen und warten, die lokale Datenbanken benötigen. Das IT-Team kann sich dann um Innovationen für die wichtigsten Unternehmensanforderungen kümmern, die dem Unternehmen dabei helfen, seine Wettbewerbsfähigkeiten digital zu transformieren und zu verbessern. Die POLARDB von Alibaba Cloud kann Herausforderungen meistern, bei denen andere handelsübliche DBaaS-Lösungen an ihre Grenzen stoßen. POLARDB bietet Unternehmen eine On-Demand-Lösung, so dass ein gutes Preis-Leistungsverhältnis bewahrt bleibt. Als handelsübliche Datenbank unterstützt sie Unternehmen bei der Verwaltung großer Datenmengen mit geringer Latenz, hohem Durchsatz, hoher QoS und schnellem Skalieren.

Intel® Optane™ SSDs und Intel® 3D NAND-SSDs für POLARDB
POLARDB wurde ursprünglich entwickelt, um den Bedürfnissen der Alibaba Cloud für das Online Shopping-Center zu entsprechen. Die Alibaba Cloud nutzte für die Stoßzeiten des Shopping Centers zunächst Intel Optane SSDs und Intel 3D NAND SSDs für POLARDB. Alibaba Cloud realisierte daraufhin eine bis zu 6-fache Leistungssteigerung für MySQL im Vergleich zur bloßen Ausführung von MySQL auf NAND-basierten PCIe NVMe SSDs.1

Heute verwendet Alibaba Cloud die Intel Optane SSD der Produktreihe DC P4800X für die POLARDB und nutzt SSDs, die:

  • die reaktionsschnellsten mit Intel® Optane™ Technik erhältlichen SSDs für Rechenzentren sind3
  • eine Kapazität von bis zu 750 GB bieten.
  • eine Leistungssteigerung für POLARDB ermöglicht haben.

Die Verwendung von Intel 3D NAND-SSDs neben Intel Optane SSDs ermöglicht eine wirtschaftliche Datenspeicherung mit hervorragender Qualität, Zuverlässigkeit sowie fortschrittlicher Verwaltbarkeit und Wartungsfreundlichkeit, um Störungen bei POLARDB zu minimieren.

Indem Intel zusammen mit Kunden wie Alibaba Cloud Neuerungen bei Datenbanken vorantreibt, verbessert es die Erfahrungswerte mit Unternehmensdatenbanken für Kunden weltweit.

Über Alibaba Cloud
Die Alibaba Cloud ist das größte E-Commerce-Business in China und ein schnell wachsender Cloud-Service-Anbieter. Alibaba Cloud bietet eine Vielzahl von globalen Cloud-Computing-Diensten, welche das Online-Business weltweit vorantreiben. Das Unternehmen verwaltet und betreut außerdem das E-Commerce-Technologieumfeld für seine Muttergesellschaft, die Alibaba Group.

Die Alibaba Cloud hat ihren Hauptsitz in Singapur und wird von dort aus weltweit betrieben. Außerdem betreibt sie Büros in Dubai, Frankfurt, Hongkong, London, New York, Paris, San Mateo, Seoul, Singapur, Sydney und Tokio.

Informationen über zugehörige Produkte und Lösungen

Skalierbare Intel® Xeon® Prozessoren

Mit der skalierbaren Intel® Xeon® Plattform lassen sich nutzbringende Erkenntnisse einfacher gewinnen. Darüber hinaus bietet die Plattform hardwarebasierte Sicherheit und ermöglicht die dynamische Bereitstellung von Diensten.

Weitere Informationen

Intel® Optane™ SSDs

Intel® Optane™ Technologie ist der erste große Durchbruch bei Arbeits- und Datenspeicher seit 25 Jahren.

Weitere Informationen

Intel® SSD DC-Serie

Intel® Rechenzentrums-SSDs sind für hohe Leistung, Zuverlässigkeit und Langlebigkeit optimiert.

Weitere Informationen

Hinweise und Disclaimer

Durch Intel® Technik ermöglichte Funktionsmerkmale und Vorteile hängen von der Systemkonfiguration ab und können entsprechend geeignete Hardware, Software oder die Aktivierung von Diensten erfordern. Die Leistungsmerkmale variieren je nach Systemkonfiguration. Kein Computersystem bietet absolute Sicherheit. Informieren Sie sich beim Systemhersteller oder Einzelhändler oder auf https://www.intel.de. In Leistungstests verwendete Software und Workloads können speziell für die Leistungseigenschaften von Intel® Mikroprozessoren optimiert worden sein. Leistungstests wie SYSmark und MobileMark werden mit spezifischen Computersystemen, Komponenten, Softwareprogrammen, Operationen und Funktionen durchgeführt. Jede Veränderung bei einem dieser Faktoren kann abweichende Ergebnisse zur Folge haben. Für eine umfassende Bewertung Ihrer vorgesehenen Anschaffung, auch im Hinblick auf die Leistung des betreffenden Produkts in Verbindung mit anderen Produkten, sollten Sie zusätzliche Informationen und Leistungstests heranziehen.Ausführlichere Informationen finden Sie unter https://www.intel.de/benchmarks. Die Leistungsergebnisse basieren auf Tests, die zum Zeitpunkt, der in den Konfigurationen angegeben ist, durchgeführt wurden und berücksichtigen möglicherweise nicht alle öffentlich verfügbaren Sicherheitsupdates. Weitere Einzelheiten finden Sie in den veröffentlichten Konfigurationsdaten. Kein Produkt und keine Komponente bieten absolute Sicherheit. // Die beschriebenen Kostensenkungsszenarien sind als Beispiele dafür gedacht, wie ein bestimmtes Produkt mit Intel®-Technik unter den genannten Umständen und in der angegebenen Konfiguration zukünftige Kosten beeinflussen und Einsparungen ermöglichen kann. Die Umstände unterscheiden sich von Fall zu Fall. Intel übernimmt keine Gewähr für Kosten oder Kostensenkungen. // Intel hat keinen Einfluss auf und keine Aufsicht über die Benchmarkdaten Dritter oder die Websites, auf die in diesem Dokument Bezug genommen wird. Besuchen Sie die genannten Websites, um sich davon zu überzeugen, dass die angeführten Benchmarkdaten zutreffen. // Bei einigen Tests wurden die Ergebnisse unter Verwendung interner Analysen oder Architektursimulationen bzw. -modellen von Intel geschätzt oder nachempfunden. Sie dienen nur informatorischen Zwecken. Unterschiede in der Hardware, Software oder Konfiguration des Systems können die tatsächliche Leistung beeinflussen.

Produkt- und Leistungsinformationen

1Test durchgeführt von der Alibaba Cloud auf zwei Zweiprozessorsystemen mit jeweils 32 Kernen, 256 GB DRAM und zwei 25 Gigabit Ethernet (GbE) Network-Interface-Controllern (NICs). 1 x Alibaba Cloud Elastic Compute Service* (ECS*), 1 x POLARDB* (1 x Datenbank und 3 x PolarStore* Replik). Benchmark: Amazon Aurora* (sysbench*), Thread = 1, iodepth = 1, 100 Prozent Schreibleistung, 4 TB Datenbank, Blockgröße anfordern = 16 KB.
2Alibaba Cloud. „100 TB Kapazität und 6-fache Leistungssteigerung mit Alibaba Cloud PolarDB.“ April 2018. alibabacloud.com/blog/100tb-kapazität-and-6x-performance-improvement-mit-alibaba-cloud-polardb_578294.
3 Reaktionsschnelligkeit definiert als durchschnittliche Leselatenz bei einer Warteschlangentiefe von 1 während einer 4K randomisierten Schreibbelastung. Ermittelt mit FIO 2.15*. Gemeinsame Konfiguration: 2x Intel® Xeon® E5-2699 v4 Prozessor (2,20 GHz, 22 Kerne), CentOS 7.2*, Kernel 3.10.0-327.el7.x86_64, 396 GB DDR-RAM bei 2,133 MHz. Evaluierte Intel® Laufwerke: 375 GB Intel® Optane™ SSD der Produktreihe DC P4800X und 1,600 GB Intel® SSD der Produktreihe DC P3700. Evaluierte Samsung*-Laufwerke: Samsung SSD PM1725a*, Samsung SSD PM1725*, Samsung SSD PM963*, Samsung SSD PM953*. Evaluiertes Micron* Laufwerk: Micron 9100 PCIe NVMe SSD*. Evaluiertes Toshiba*-Laufwerk: Toshiba ZD6300*. Test: Warteschlangentiefe 1, wahlfreies Lesen, 4K Latenz; Warteschlangentiefe 1, zufälliges Lesen/Schreiben, 4K 70 Prozent Leselatenz,Warteschlangentiefe 1, randomisiertes Schreiben, 4K Latenz mit FIO 2.15.