Telefónica: Anspruchvollste SLA-Anforderungen erfüllen

Virtuelles Rechenzentrum mit hohem Durchsatz, geringer Latenz auf skalierbaren vSAN*, Intel® Xeon® Prozessoren und Intel® Optane™ DC SSDs.

Telefónica ist eines der größten Telekommunikationsunternehmen der Welt. Das Unternehmen mit Sitz in Madrid operiert in 16 Ländern und bedient mehr als 336 Millionen Kunden. Der Wunsch nach mehr Einfachheit, Effizienz und Agilität in Kombination mit hybriden Bereitstellungen und Infrastruktur-Aktualisierungszyklen bringt Cloud-Service-Provider (CSPs) wie Telefónica zur hyperkonvergierten Infrastruktur (Hyperconverged Infrastructure, HCI). Telefónica arbeitete mit Intel, VMware und dem Server-Originalhersteller (OEM) zusammen, um einen Konzeptnachweis zu erbringen. Dabei wurde erkundet, wie HCI zwei wichtige Geschäftsprobleme beheben könnte: Senken von Rechenzentrumskosten und Verbesserung der Verwaltbarkeit von Rechenzentren. Allerdings sollte sich dies nicht negativ auf die Leistung des Telefónica Virtual Data Center (VDC)-Service weltweit auswirken.

Herausforderung
Der Telefónica VDC-Service hat sich im Lauf der Zeit entwickelt, daher behinderte die heterogene Rechenzentrumsumgebung die betriebliche Effizienz und wirkte sich negativ auf die Gesamtbetriebskosten (TCO) aus. Telefónica erkannte den potentiellen Geschäftswert einer HCI-Lösung und VMware als führenden Anbieter von Enterprise-Softwaretechnologie an und definierte eine konsolidierte Plattform, die leicht zu verwalten sein und einen hervorragenden Durchsatz bieten sollte. Die in der Testplattform verwendeten Cache-Geräte boten aber nicht die geringe Speicherlatenz, die für die missionskritischen Workloads der Telefónica-Kunden vorgegeben waren. Dies bedeutete, dass bei Bereitstellung der Testlösung Telefónica zwei Architekturen pflegen müsste: die vSAN*-Plattform für weniger strikte Speicher-Service-Level-Agreements (SLAs) und ein herkömmliches Speichernetzwerk (Storage Area Network, SAN) für die Top-Tier-SLAs.

Lösung
Die Antwort auf das Latenzproblem war die Nutzung einer neuen Technologie für die vSAN-Caching-Stufe: Intel® Optane™ DC SSDs. Damit konnte Telefónicas vSAN-basierte Infrastruktur die anspruchsvollsten SLAs von Telefónica erfüllen. Intel Optane DC SSDs bieten einheitliche Latenz, Quality of Service und geringe Latenz bei anspruchsvollen gemischten Lese-/Schreibe-Workloads, wie sie in der Speicher-Caching-Layer häufig vorkommen, wodurch Daten schnell an CPU und Anwendungen geliefert werden können. Eine optimierte HCI-Lösung basierend auf den neuesten VMware- und Intel® Technologien war genau, was Telefónica und ihre Kunden benötigten.

„Endlich erhalten wir ein hyperkonvergiertes System, das die Leistung unserer traditionellen Top-Tier-Speicher erreichen oder übertreffen kann.“ – José María Cuéllar, B2B Global Cloud Director, Telefónica Business Solutions

Die richtige Plattform für Leistung und betriebliche Effizienz finden
Mit Ausweitung des VDC-Service durch Telefónica im Verlauf der Jahre stellte das Unternehmen in verschiedenen Ländern neue VDC-Knoten bereit. Die Konzentration auf die Nutzung lokaler Beschaffungsvereinbarungen und die Expertise lokaler Betriebsteams führte zu verschiedenen VDC-Knoten, die eine Vielzahl verschiedener Server und andere Hardware von verschiedenen Anbietern verwendeten. Mit zunehmendem Knotenwachstum wurde die heterogene Rechenzentrums-Umgebung immer schwieriger zu verwalten und die Governance immer komplizierter. Weil es so viele verschiedene Konfigurationen und Management-Tools für die unterschiedlichen VDC-Knoten in Spanien, Brasilien, den USA, Kolumbien, Mexiko, Chile, Peru und Argentinien gab, waren die betrieblichen Operationsteams sehr groß. Das Endergebnis: stetig steigende Kosten.

Auf der Suche nach einem besseren Betriebsmodell beschloss Telefónica, sich mit HCI auseinanderzusetzen, vollständig skalierbarer, Software-integrierter Infrastruktur, die einen modularen Ansatz für Computing, Netzwerk und Speicherung auf Standard-Hardware nutzt und dabei verteilte, horizontale Bausteine unter einheitlichem Management einsetzt. HCI vereinfacht betriebliche Aufgaben, indem komplexe SANs eliminiert und Speicherung und Computing auf einem einzigen Knoten konsolidiert werden. In der gesamten Cloud-Services-Branche ersetzt HCI schnell SAN: Es wird erwartet, dass der globale HCI-Markt von 4,1 Mrd. US-Dollar im Jahr 2018 auf 17,1 Mrd. bis 2023 anwachsen wird, das bedeutet eine jährliche Wachstumsrate (Compound Annual Growth Rate, CAGR) von 32,9 Prozent.1 VMware ist ein führender Anbieter von HCI-Lösungen und bietet einen hohen Grad an Flexibilität, Umfang und Innovation.

Telefónica wählte vSAN als Fundament für die Entwicklung einer homogenen VDC-Dienstplattform basierend auf skalierbaren Intel® Xeon® Prozessoren und arbeitete mit VMware, Intel und dem Server-OEM-Unternehmen zusammen, um eine vSAN-Konfiguration und einen Testplan zu definieren. Tests zeigten, dass die Plattform das Top-Tier-Speicher-SLA (Platin) von Telefónica nicht einhalten konnte. Dies bedeutete, dass Telefónica weiterhin für die Platin-Speicherung herkömmliche Speicherausrüstung nutzen musste, was die mit vSAN erwarteten betrieblichen Effizienzgewinne unterminierte. Nach einer weiteren Konsultation mit Intel und VMware beschloss Telefónica, Intel Optane DC SSDs für den vSAN-Cache zu evaluieren, um festzustellen, ob das Unternehmen mit diesem Ansatz alle kritischen Leistungsauflagen wie z. B. hohen Durchsatz und niedrige Latenz erfüllen konnte.

Differenzierung durch niedrige Latenz, hohe Leistung und Kosteneffizienz
VMware und Intel fühlten sich verpflichtet, Best-in-Class-vSAN HCI-Lösungen zu liefern, die auf der neuesten Intel Optane SSD-Technologie basieren sollten. Die beiden Unternehmen arbeiteten eng mit Telefónica zusammen, um ihre vSAN-Plattform speziell anzupassen und die geschäftlichen Anforderungen von Telefónica zu erfüllen. Die drei Teams entwickelten einen Testplan und arbeiteten sich durch die verschiedenen Systemoptimierungen. Die Nutzung von Intel Optane DC SSDs für den vSAN-Cache bot drei wichtige Leistungsvorteile, die nachstehend ausführlicher erläutert werden.

  • Keine Überlastung des internen Speicher-I/O-Verkehrs
  • Lineare Leistungsskalierung mit zunehmender Blockgröße
  • Einheitlich hoher Durchsatz, selbst wenn sich Cluster-Kapazitätsbelegung 100 Prozent annähert

Eliminierung von vSAN-Überlastung ist Schlüssel zur Erfüllung strikter SLA-Anforderungen
Die Original vSAN-Konfiguration von Telefónica verwendete für den vSAN-Cache NAND-basierte SSDs. SSDs dieser Art bieten eine mangelnde Leistung bei gemischten Lese/Schreib-Operationen, was zu signifikanten Datenstaus an den Cache- und Kapazitäts-SSDs für große Datensätze führt.2 Diese Datenstaus erhöhten die Latenz über den für Telefónicas Platin-Speicher-Tier akzeptablen Wert.

Die Neukonfiguration der vSAN-Knoten mit Intel Optane DC SSDs reduzierte die Staus bei großen Datensätzen im gesamten Cluster von vier vSAN-Knoten.3 Dadurch konnte der vSAN-Cluster anhaltend hohe Durchsätze, niedrige Latenz und einheitliches Verhalten über Zeit für unterschiedliche I/O-Muster bieten, also genau das, was Telefónica benötigte.

Schnelle Zwischenspeicherung ermöglicht lineare Leistungsskalierung
Eine weitere wichtige Metrik für die VDC-Knoten von Telefónica ist die lineare Skalierbarkeit, d. h. bei zunehmender Workload nimmt auch der Durchsatz zu. Wie in Abbildung 1 ersichtlich ist dies genau, was der Intel Optane DC SSD-basierte vSAN-Cache im Konzeptnachweis bestätigte. Mit zunehmender Blockgröße im Test nahm auch der Durchsatz (in MB/Sekunde gemessen) linear zu. Obgleich auch die Latenz zunahm, handelt es sich wiederum um einen linearen Anstieg entsprechend der Änderungen der Blockgröße, keine plötzliche Spitze, die auf einen Engpass hindeuten würde.4

Abbildung 1: Wenn die Blockgröße von 4K auf 16K und 32K zunahm, zeigten die Tests von Telefónica, dass durch die Nutzung von Intel® Optane™ DC Solid State Drives (SSDs) für die vSAN*-Cache-Tier ein linear skalierter Durchsatz (MB/s) ermöglicht wurde.4

Nachhaltiger hoher Durchsatz und geringe Latenz
Abbildung 2 zeigt die Leistung des Test-Clusters im anspruchsvollsten Szenario für einen vSAN-Schreib-Cache, bei dem die Workload 100 Prozent Schreiben und 100 Prozent sequentiell beträgt. Normalerweise würde dieses Szenario zu einer Beeinträchtigung des Durchsatz und Latenzsteigerung führen, lange bevor die Cluster-Belegungslimits errreicht sind, die von VMware für vSAN empfohlen werden.5

Abbildung 2. Intel® Optane™ DC Solid State Drives (SSDs) im vSAN*-Cache-Tier ermöglichen einen Durchsatz und eine Latenz, die der Leistung eines Flash-Speicher-Arrays entsprechen, selbst wenn sich die Cluster-Kapazitätsbelegung 100 Prozent annähert.6

Dank der schnellen Reaktion der Intel Optane DC SSDs im vSAN-Cache-Tier bleibt der Durchsatz beständig, selbst wenn der Arbeitsdatensatz auf höhere Cluster-Nutzungswerte ansteigt, und die Latenz bleibt ähnlich wie bei einem Flash-Speicher-Array, allerdings ohne dessen Kosten und Komplexität.

Mit Intel Optane DC SSDs als Cache-Gerät können Telefónica-Kunden eine einheitliche, erstklassige I/O-Leistung erwarten. Wenn die Lösung an Telefónica-VDC-Knoten bereitgestellt ist, können Endbenutzer die Vorteile der schnellen, effizienten Workload-Ausführung der Plattform genießen. Basierend auf den hervorragenden Ergebnissen für HCI mit Intel Optane DC SSDs erwartet Telefónica, vSAN für alle VDC-Knoten des Unternehmens bereitzustellen. Dies bietet folgende erwartete Vorteile:

  • Eine konsolidierte, moderne virtuelle Infrastruktur. Mit ausgeglichenen Rechen- und Speicherressourcen können Telefónica-Kunden IOPS-intensive Operationen auf ihren virtuellen Maschinen (VMs) ausführen.
  • Eine einzige, homogene Plattform. VMware- und Intel-Technologien ergeben zusammen eine Hochleistungsplattform, die alle kritischen Geschäftsanforderungen von Telefónica erfüllen kann, während gleichzeitig konsistente Uptime und Verfügbarkeit bereitgestellt werden.
  • Fähigkeit, anspruchsvollen SLAs zu entsprechen. Selbst bei hoher Cluster-Belegung und hohen Blockgrößen erfüllen Durchsatz und Latenz (beides wichtige Metriken für die Telefónica-Kundenerfahrung und -zufriedenheit) die strikten SLA-Anforderungen von Telefónica für verschiedene Workloads. Insbesondere behielt das Testsystem fast eine halbe Million I/O pro Sekunde (IOPS) bei einer Latenz unter 1,5 ms für sowohl zufällige als auch sequenzielle Lesevorgänge bei.7
  • Effizienter Betrieb. Operationsteams werden aufgrund der Vereinfachung und Standardisierung der VDC-Knoten kompakter.
  • Schnelle Infrastrukturbereitstellung. Telefónica muss nicht länger komplexe SAN- und Speicher-Arrays konfigurieren.

Telefónica plant weitere Tests, die zu weiteren Leistungsverbesserungen und Kostenreduzierungen führen sollten. Die Test-Roadmap umfasst skalierbare Intel® Xeon® Professoren der zweiten Generation sowie weitere Intel® Optane™ Technologie.

VMware* und Intel: Virtualisierte Umgebungen der nächsten Generation ermöglichen
Seit mehr als zehn Jahren arbeiten Intel und VMware zusammen, um innovative Rechenzentrums-Transformationslösungen zu liefern. Diese Partnerschaft wird weiter mittels optimierter hyperkonvergierter VMware-Lösungen basierend auf Intel® Architektur fortgesetzt. Mit VMware-Software und Best-in-Class-Computing-, Speicher- und Netzwerk-Hardware können Anbieter von Cloud-Diensten zuversichtlich skalieren und ihr Geschäft ausweiten, während gleichzeitig für Geschäftsagilität, Sicherheitsfunktionen und betriebliche Effizienz gesorgt wird.

Im Blickpunkt: Telefónica
Mit einem Umsatz im Jahr 2017 von mehr als 52 Milliarden Euro ist Telefónica einer der führenden Telekommunikationsanbieter der Welt. Zu den Produkten zählt eine Vielzahl verschiedener Geschäftslösungen in den Bereichen Vernetzung, Mobilität, Produktivität und Kollaboration, Sicherheit, Internet der Dinge (IoT), Big Data und Cloud-Dienste. Eine der Geschäftseinheiten des Unternehmens, Telefónica Business Solutions, verschreibt sich ganz dem globalen Management von Geschäftssparten für Unternehmen, multinationale Konzerne, Großhandel (Festnetz- und Mobiltelefonbetreiber, ISPs und Content-Anbieter) sowie Roaming.

Das Cloud-Services-Geschäft von Telefónica macht 50 Prozent des Umsatzes aus dem B2B-Digitalgeschäft des Unternehmens aus. Sein Virtual Data Center (VDC)-Service bietet die gleichen Kapazitäten und Netzwerktopoligien, Sicherheit und Zuverlässigkeit, die Telefónica-Kunden von ihren eigenen Rechenzentren gewohnt sind, sowie zusätzliche Vorteile wie Virtualisierung, Automatisierung und Cloud-Computing-Technologien. Telefónica betreibt den VDC-Dienst in acht Ländern in Europa, Nordamerika und Südamerika. Der VDC-Dienst umfasst Konnektivität von Weltklasse, ein umfassendes Selbstverwaltungs-Portal mit API, lokale Knoten für Compliance und Latenz sowie Unterstützung in Ortssprachen.

Technische Komponenten der Lösung
Die für den Konzeptnachweis eingesetzte Prüfstandkonfiguration bestand aus den folgenden Elementen (Produktionskonfiguration kann davon abweichen):

  • Flash-optimierter Speicher mit VMware vSAN* v6.7
  • Intel® Xeon® Gold 6130 Hochleistungs-Prozessoren
  • vSAN-Cache-Laufwerke: Intel® Optane™ SSD DC P4800X
  • vSAN-Kapazitätslaufwerke: Intel® SSD DC P4500 (NVMe*-basiert)
  • Netzwerkschnittstellenkarte (Network Interface Card, NIC): Intel® XL710-Q1 1-Port 40 GbE
  • HPE ProLiant* Gen10-Server

Informationen über zugehörige Produkte und Lösungen

Skalierbare Intel® Xeon® Prozessorreihe

Mit der skalierbaren Intel® Xeon® Plattform lassen sich nutzbringende Erkenntnisse einfacher gewinnen. Darüber hinaus bietet die Plattform hardwarebasierte Sicherheit und ermöglicht die dynamische Bereitstellung von Diensten.

Weitere Infos

Intel® Optane™ DC SSDs

Intel® Optane™ Technologie ist die erste bahnbrechende Speicherneuentwicklung in 25 Jahren.

Weitere Infos

Intel® SSD DC-Serie

Intel® Rechenzentrums-SSDs sind für hohe Leistung, Zuverlässigkeit und Langlebigkeit optimiert.

Weitere Infos

Hinweise und Disclaimer

Durch Intel® Technik ermöglichte Funktionsmerkmale und Vorteile hängen von der Systemkonfiguration ab und können entsprechend geeignete Hardware, Software oder die Aktivierung von Diensten erfordern. Die Leistungsmerkmale variieren je nach Systemkonfiguration. Kein Computersystem bietet absolute Sicherheit. Informieren Sie sich beim Systemhersteller oder Einzelhändler oder auf https://www.intel.de. In Leistungstests verwendete Software und Workloads können speziell für die Leistungseigenschaften von Intel® Mikroprozessoren optimiert worden sein. Leistungstests wie SYSmark und MobileMark werden mit spezifischen Computersystemen, Komponenten, Softwareprogrammen, Operationen und Funktionen durchgeführt. Jede Veränderung bei einem dieser Faktoren kann abweichende Ergebnisse zur Folge haben. Für eine umfassende Bewertung Ihrer vorgesehenen Anschaffung, auch im Hinblick auf die Leistung des betreffenden Produkts in Verbindung mit anderen Produkten, sollten Sie zusätzliche Informationen und Leistungstests heranziehen.Ausführlichere Informationen finden Sie unter https://www.intel.de/benchmarks. Die Leistungsergebnisse basieren auf Tests, die zum Zeitpunkt, der in den Konfigurationen angegeben ist, durchgeführt wurden und berücksichtigen möglicherweise nicht alle öffentlich verfügbaren Sicherheitsupdates. Weitere Einzelheiten finden Sie in den veröffentlichten Konfigurationsdaten. Kein Produkt und keine Komponente bieten absolute Sicherheit. // Die beschriebenen Kostensenkungsszenarien sind als Beispiele dafür gedacht, wie ein bestimmtes Produkt mit Intel®-Technik unter den genannten Umständen und in der angegebenen Konfiguration zukünftige Kosten beeinflussen und Einsparungen ermöglichen kann. Die Umstände unterscheiden sich von Fall zu Fall. Intel übernimmt keine Gewähr für Kosten oder Kostensenkungen. // Intel hat keinen Einfluss auf und keine Aufsicht über die Benchmarkdaten Dritter oder die Websites, auf die in diesem Dokument Bezug genommen wird. Besuchen Sie die genannten Websites, um sich davon zu überzeugen, dass die angeführten Benchmarkdaten zutreffen. // Bei einigen Tests wurden die Ergebnisse unter Verwendung interner Analysen oder Architektursimulationen bzw. -modellen von Intel geschätzt oder nachempfunden. Sie dienen nur informatorischen Zwecken. Unterschiede in der Hardware, Software oder Konfiguration des Systems können die tatsächliche Leistung beeinflussen.

Produkt- und Leistungsinformationen

2

Congestion (Überlastung) ist ein Feedback-Mechanismus zur Reduzierung der Rate eingehender I/O-Anforderungen von der vSAN-Client-Ebene auf ein Niveau, das die vSAN-Datenträgergruppen bedienen können, wobei die Latenz von den niedrigeren Ebenen zum Eingang der Anforderungen verlagert wird, ohne dass der Gesamtdurchsatz des Systems geändert wird. Dies vermeidet verschwendete CPU-Zyklen bei der Verarbeitung von I/O-Anforderungen, die eventuell verlorengehen könnten. Anhaltende und große Werte für die Überlastung (Congestion) können zu höherer Latenz und geringerem Durchsatz als gewünscht führen.

3

Workload: 4 KB Blockgröße, 70 % Lesen / 30 % Schreiben, 100 % beliebig, 33 % Cluster Occupation, Failures to tolerate (FTT) = 1.

4

Workload: 70 % Lesen / 30 % Schreiben, 100 % beliebig, 33 % Cluster Occupation, 64 % Schreib-Cache-Occupation, mit Blockgrößen von 4, 16 und 32 KB, Failures to tolerate = 1.

5

VMware empfiehlt mind. 20 Prozent Slack-Speicher auf vSAN Cluster, um eine Neuverteilung auf dem Speichermedium zu vermeiden.

6

Workload: 4 KB Blockgröße, 100 % Schreiben, 100 % sequentiell, verschiedene Kapazitäten der Cluster Occupation, Failures to tolerate (FTT) = 1.

7

Workload: 4 KB Blockgröße, 33 % Cluster Occupation, Failures to tolerate (FTT) = 1.