Reduzieren Sie die Zeit zum Abschließen von Databricks-Abfragen um bis zu 80 % und sparen Sie bis zu 61 % mit Microsoft Azure Edsv4-VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation

Databricks

  • Bis zu 80 % weniger Zeit zum Ausführung von Abfragen zur Entscheidungsunterstützung mit PhotonEnabled E8ds_v4-VMs im Vergleich zu älteren E8s_v3-VMs.

  • Bis zu 61 % geringere Kosten für die Ausführung von Abfragen zur Entscheidungsunterstützung mit PhotonEnabled E8ds_v4-VMs im Vergleich zu älteren E8s_v3-VMs.

author-image

Von

Diese VMs mit aktivierter Photon Vectorized Query Engine lieferten eine stärkere Arbeitslastleistung zur Entscheidungsunterstützung als ältere VMs mit Prozessoren der vorherigen Generation

Die Auswahl der richtigen Hardware ist entscheidend, um eine optimale Leistung für Ihre Workloads zur Entscheidungsunterstützung zu erzielen. Es mag offensichtlich erscheinen, dass aktualisierte Hardware eine bessere Leistung liefert, aber es ist nicht immer klar, wie viel Verbesserung Ihr Unternehmen erwarten kann, wenn Sie sich für die neuere Option entscheiden, und wie viel diese zusätzliche Leistung kostet. Um diese Fragen zu untersuchen, haben wir eine Workload zur Entscheidungsunterstützung auf einem E8s_v3-Cluster mit 20 Knoten mit Databricks Runtime 9,0 getestet, um eine grundlegende Leistungsmetrik zu erhalten. Die ältere Esv3-Reihe von Azure bietet VMs mit Prozessoren vom Intel® Xeon® E5-2673 v4 bis zum Intel Xeon 8272CL. Jedes Mal, wenn Sie eine VM hochfahren, weist Azure zufällig einen Prozessor zu. Dies bedeutet, dass ein 20-Knoten-Cluster eine Mischung aus CPU-Typen verwenden könnte, wobei einige bis zu drei Intel-CPU-Generationen hinter den neuesten Prozessoren zurückliegen. Aus Konsistenzgründen haben wir sichergestellt, dass alle E8s_v3-VMs denselben Intel Xeon Platinum 8171M-Prozessor aufführten, als wir mit unseren Tests begannen. Anschließend haben wir dieselbe Workload auf einem E8ds_v4-Cluster mit 20 Knoten getestet. Azure garantiert, dass jede Edsv4-VM einen Intel Xeon Platinum 8272CL-Prozessor verwendet, der zuverlässige Leistung liefert. Auf den neueren VMs haben wir Photon aktiviert, eine vektorisierte Abfrage-Engine, die die SQL-Abfrageleistung beschleunigen kann.

Verbessern Sie die Leistung vom Data Warehouse mithilfe von Photon

Der TPC-DS-Benchmark zur Entscheidungsunterstützung misst die Data Warehouse-Leistung in Bezug auf die Zeit zum Ausführen einer Reihe von Abfragen. Kürzere Zeiten bedeuten, dass Sie früher Erkenntnisse gewinnen und die VM-Betriebszeit reduzieren, für die Sie bezahlen müssen. Abbildung 1 macht die Leistungsvorteile eines Upgrades auf die neueren E8ds_v4-VMs mit aktiviertem Photon sehr deutlich. Mit dem 1 TB großen Datensatz reduzierte die E8ds_v4-Cluster-Abfrage die Fertigstellungszeit auf nur 26 % der Zeit des E8s_v3-Clusters. Mit dem 10 TB-Datensatz war die Abfragezeit des E8ds_v4-Clusters sogar um ein Fünftel niedriger als die des E8s_v3-Clusters.

Abbildung 1: Die relative Verarbeitungszeit für die 99 Entscheidungsunterstützungs-Benchmark-Abfragen auf einem Photon-aktivierten E8ds_v4 VM-Cluster mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation im Vergleich zu einem E8as_v3-Cluster auf 1 TB und 10 TB großen Datensätzen.

Holen Sie sich ein besseres Preis-Leistungs-Verhältnis durch ein Upgrade

Angesichts der dramatisch verbesserten Abfragezeiten, die wir auf der vorherigen Seite zeigen, könnte man annehmen, dass es sich lohnen würde, für die neueren VMs extra zu bezahlen. Abbildung 2 bestätigt diese. Anhand des öffentlichen Stundensatzes zum Zeitpunkt des Tests haben wir die Kosten für die Ausführung der einzelnen Workload-Szenarien ermittelt. Wir haben die gesamte Abfrageverarbeitungszeit von Millisekunden in Stunden umgerechnet, die stündlichen Kosten für die Instanzen und den Speicherplatz kombiniert und den Preis pro TB für alle vier Szenarien berechnet. Wir haben herausgefunden, dass die Ausführung eines Entscheidungsunterstützungs-Workloads mit einem 1 TB großen Datensatz auf dem älteren E8s_v3-Cluster fast doppelt so viel kosten würde wie auf dem photon-aktivierten E8ds_v4-Cluster. Noch beeindruckender ist, dass die Ausführung des 10 TB Datensatzes auf dem E8ds_v4-Cluster deutlich weniger als die Hälfte des Preises des älteren E8s_v3-Clusters kosten würde, was einer Einsparung von 61 % entspricht.

Abbildung 2: Normalisiertes Preis-/Leistungsverhältnis für die Ausführung einer Entscheidungshilfe-Workload in einer Databricks-Umgebung auf Photon-aktivierten Azure E8s_v3 VMs im Vergleich zu E8as_v4 VMs auf 1 TB und 10 TB Datensätzen.

Fazit

Wir haben festgestellt, dass Workloads zur Entscheidungsunterstützung auf Photon-fähigen E8ds_v4-VMs mit 8-vCPUs und skalierbaren Intel® Xeon®-Prozessoren der 2. Generation im Vergleich zu älteren E8s_v3-VMs nur ein Drittel der Zeit absolvieren. Diese Leistungssteigerung führte zu Kosteneinsparungen von bis zu 61 %. Dies macht Photon-fähige E8ds_v4-VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation zu einer hervorragenden Wahl für Ihre Datenanalyse-Workloads.

Weitere Informationen

Wenn Sie Ihre Databricks-Cluster auf Photon-aktivierten Microsoft Azure Edsv4 VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation betreiben möchten, besuchen Sie https://docs.microsoft.com/en-us/azure/virtual-machines/edv4-edsv4-series.

Um mehr über die hier beschriebenen Ergebnisse zu erfahren und zu erfahren, wie die Microsoft Azure Edsv4-VMs im Vergleich zu ähnlichen AMD-VMs abschneiden, lesen Sie den Bericht unter https://www.intel.de/content/www/de/de/partner/workload/microsoft/enhance-databricks-azure-vms-benchmark.html.