Indizieren Sie bis zu 2,49-mal so viele Dokumente pro Sekunde und verkürzen Sie die Suchzeiten für Elasticsearch-Workloads mit Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation

Elasticsearch

  • Indizieren Sie bis zu 2,49-mal so viele Dokumente pro Sekunde auf Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation im Vergleich zu Dsv3-Instanzen.

  • Reduzieren Sie Suchzeiten um 69 % auf Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation im Vergleich zu Dsv3-Instances.

author-image

Von

Ddsv5-VMs beschleunigten die Indizierung gegenüber Dsv3- und Ddsv4-VMs mit Prozessoren der vorherigen Generation.

Microsoft Azure Kubernetes Services (AKS) bietet Unternehmen, die Elasticsearch-Workloads auf Kubernetes-Clustern in der Cloud ausführen, Flexibilität und Agilität. Welcher VM-Typ bietet die beste Leistung für diese Workloads? Um das herauszufinden, haben wir die Elasticsearch-Leistung von drei Instance-Typen in einer containerisierten Kubernetes-Umgebung verglichen:

  • Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation
  • Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation
  • Microsoft Azure Dsv3-VMs mit Intel Xeon E5-2673 v4 Prozessoren

Um die Leistung von Elasticsearch zu quantifizieren, haben wir das Benchmark-Tool Rally 2.3.0 verwendet, das als Lastgenerator fungiert und während Such-Workloads Telemetriemetriken in Elasticsearch aufzeichnet und speichert, um Leistungsprobleme zum Vergleich zwischen Clustern zu finden. Unter Verwendung von zwei Datensätzen von Rally, nyc_taxis (ein Transportanalyse-Datensatz) und http_logs (ein Webdienst-Datensatz), fanden wir heraus, dass Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation bis zu 2,49-mal so viele Dokumente pro Sekunde mit so viel indizierten B. um 69 Prozent kürzere Suchzeiten im Vergleich zu einem Azure Dsv3-VM-Cluster. Darüber hinaus übertrafen die Ddsv5-VMs die Ddsv4-VMs um bis zu 30 Prozent beim Indizierungsdurchsatz mit um 29 Prozent kürzeren Suchzeiten. Weitere Informationen über Rally und die verwendeten Workloads finden Sie unten.

Dies zeigt, dass über mehrere Elasticsearch-Workloads hinweg die Auswahl von Azure Ddsv5-VMs mit der neuesten Prozessortechnologie eine bessere Leistung von Azure Kubernetes Services bieten kann als VMs, die auf zwei früheren Prozessorgenerationen basieren. Durch die schnellere Indizierung von Inhalten erhalten Unternehmen die Daten, die sie für wichtige Geschäftsentscheidungen benötigen, in kürzerer Zeit.

Indizieren Sie Daten schneller, um schnellere Erkenntnisse mit Azure Ddsv5-VMs zu gewinnen

Während Organisationen Elasticsearch für viele Anwendungsfälle verwenden, einschließlich Überwachung der Anwendungsleistung, Anwendungssuchen und Geschäftsanalysen, haben wir den Indizierungsdurchsatz für eine Transportanalyse-Workload und eine typische Webdienst-Workload verglichen (siehe Abbildung 1).

Unter Verwendung des nyc_taxis-Datensatzes, der Daten zu Taxifahrten in NYC aus dem Jahr 2015 speichert und Suchszenarien ausführt, indizierten Ddsv4-VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation 53 Prozent mehr Dokumente/Sekunde (docs/s) als der Dsv3-VM-Cluster. Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation verbesserten die Leistung noch weiter und boten 91 Prozent mehr Dokumente/s als die Dsv3-VMs.

Beim http_logs-Datensatz, das beispielhafte HTTP-Serverprotokolldaten verwendet und Suchszenarien ausführt, zeigten die VM-Typen erneut eine ähnliche Leistungsskalierung gegenüber den Dsv3-VMs. Azure Ddsv4-VMs hatten 92 Prozent mehr Durchsatz, während Ddsv5-VMs, die durch skalierbare Intel® Xeon® Prozessoren der 3. Generation aktiviert wurden, 2,49-mal so viel Durchsatz hatten, was eine deutlich schnellere Indizierung ermöglichte.

Abbildung 1: Der relative Indizierungsdurchsatz in Dokumenten pro Sekunde, den die Cluster beim Ausführen von zwei Arten von Datensätzen aus dem Rally-Benchmark erreicht haben, um die Leistung von Elasticsearch zu bewerten. Höhere Zahlen sind besser.

Reduzieren Sie Suchzeiten mit Azure Ddsv5-VMs

Der Rally-Benchmark erfasste auch die Suchlatenz beim Ausführen von Elasticsearch-Workloads. Kürzere Suchzeiten bedeuten, dass Organisationen nicht so lange warten müssen, um Erkenntnisse aus ihren Daten zu gewinnen. Abbildung 2 vergleicht die normalisierte Suchlatenz, die die VMs für die Datensätze „nyc_taxis“ und „http_logs“ erfahren haben. Ddsv4-VMs mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation reduzierten die Suchlatenz um 33 Prozent bzw. 44 Prozent. Die neuesten Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation verkürzten die Wartezeiten noch weiter und reduzierten die Suchlatenz im Vergleich zu den Dsv3-VMs um 56 Prozent bzw. 69 Prozent.

Abbildung 2: Die relative Suchlatenz in Millisekunden, die die Cluster beim Ausführen von zwei Arten von Datensätzen aus dem Rally-Benchmark erreicht haben, um die Leistung von Elasticsearch zu bewerten. Kürzere Zahlen sind besser.

Fazit

Unabhängig von Ihrem speziellen Anwendungsfall für Elasticsearch kann die Indizierung von mehr Inhalten pro Sekunde zu schnelleren Erkenntnissen führen. Tests zeigen, dass die Auswahl von Microsoft Azure Ddsv5-VMs mit skalierbaren Intel® Xeon® Prozessoren der 3. Generation zum Ausführen von Elasticsearch auf Kubernetes-Clustern den Indizierungsdurchsatz und die Suchzeiten für mehrere Anwendungsfälle verbessern kann.

Wenn der von Ihnen gewählte Cloud-Instanztyp mehr Daten in kürzerer Zeit für schnellere Dateneinblicke indizieren kann, kann dies auch die Anzahl der Instanzen reduzieren, die Sie kaufen müssen, was möglicherweise Ihre Betriebskosten senkt.

Weitere Informationen

Um mit der Ausführung Ihrer Elasticsearch-Workloads auf Microsoft Azure Ddsv5-VMs zu beginnen, besuchen Sie https://docs.microsoft.com/en-us/azure/virtual-machines/ddv5-ddsv5-series.

Weitere Informationen über Elastic finden Sie unter https://www.elastic.co/.

Um das Rally-Benchmark-Tool zu verwenden, besuchen Sie https://github.com/elastic/rally. Sie können beide Datensätze, die zum Testen verwendet werden, unter https://github.com/elastic/rally-tracks/tree/master/http_logs und https://github.com/elastic/rally-tracks/tree/master/http_logs finden