CERN: Hybrid-Cloud ermöglicht bahnbrechende Forschung

Wissenschaftler nutzen den weltweit größten Teilchenbeschleuniger und Intel® Technik, um die Zusammensetzung des Universums zu verstehen.

Kurzübersicht
Im CERN, der Europäische Organisation für Kernforschung, werden die subatomaren Bausteine studiert, die alles im Universum umfassen. Der Large Hadron Collider (LHC) ist der größte Teilchenbeschleuniger der Welt. Er besteht aus einem Ring mit 27 Kilometer Umfang, in dem zwei Strahlen aus subatomaren Teilchen in gegenläufiger Richtung auf beinahe Lichtgeschwindigkeit beschleunigt werden. Wenn die Strahlen aufeinandertreffen, zersplittern die Teilchen in ihre elementarsten Komponenten. Detektoren erfassen riesige Mengen an Echtzeit-Daten, die beim Aufprall generiert werden. Die Daten werden anschließend gespeichert und mithilfe der Hybrid-Cloud-Lösung des CERN mittels Data-Mining auf Erkenntnisse untersucht.

Herausforderung
Ironischerweise erfordert das Verständnis der kleinsten Teilchen unseres Universums enorme Rechenleistung, um aus den umfangreichen Datenmengen Erkenntnisse abzuleiten. Sekündlich erfassen hochsensible Detektoren Petabyte an Daten, die bei jeder Versuchsreihe, die mit dem HHC ausgeführt wird, entstehen. Obwohl ein Filterprozess diese Menge reduziert, verbleiben immer noch Gigabyte an Daten, die vor Ort in Echtzeit erfasst und gespeichert werden müssen. Als Ergänzung der internen Infrastruktur benötigt das CERN eine schnelle, skalierbare und budgetschonende Rechen- und Datenspeicherlösung für die Simulation und Modellierung der resultierenden Daten.

Lösung
Da die Bandbreite zwischen den Cloud-Service-Providern (CSPs) und der CERN-Einrichtung praktische Grenzen hat, verbleibt der Datenerfassungprozess des LHC lokal in den CERN-eigenen Rechenzentren, die für diese Aufgabe ausgelegt sind. Nach der Datensammlungsphase verwalten die gehosteten Cloud-Lösungen den Datenauswertungsprozess des CERN. Zwei CSPs designten Speziallösungen für die CERN-Spezifizierungen im Bereich Datenspeicher, Sicherheit, Leistung und Hosting von Anwendungen. Beide CSPs stellten erweiterbar Virtual-Machine-Funktionalität (VM) und umfangreichen Datenspeicher bereit, um die Modellierung und Simulation von LHC-Daten zu erleichtern.

Large-Hadron-Collider-Tunnel im CERN (Foto mit freundlicher Genehmigung von CERN)

Ergebnisse
Beide CSPs bauten und testeten einen für die CERN-Anforderungen maßgeschneiderten Hybrid-Cloud-Prototypen. Jede gehostete Lösung bietet die Datenspeicher-, Verarbeitungs- und Vernetzungsgeschwindigkeit, die das CERN heute benötigt, und einen optimierten Wachstumspfad für künftige Anforderungen. Da sich die gehostete Cloud-Lösung, sofern sie nicht gerade vom CERN verwendet wird, von anderen Forschungsorganisationen in Europa für andere Zwecke einsetzen lässt, ist die finanzielle Investition für eine vielfältige Gruppe von Wissenschaftlern von Vorteil. Die Hybrid-Cloud sorgt so für breitgefächerten Nutzen und ein besseres Preis-Leistungs-Verhältnis.

„Unser Team sucht ständig nach Möglichkeiten für die Optimierung und Beschleunigung unserer Infrastruktur. Daher sind Hybrid-Cloud-Lösungen für unsere Arbeit extrem wichtig. Unsere Aufgabe ist es sicherzustellen, dass die IT die Physik nicht einschränkt.“ – Tim Bell, Compute and Monitoring Group Leader, IT Department, CERN

Die Hybrid-Cloud ebnet den Weg für umfangreiche Simulationen und spezielle Anforderungen
Es hat sich gezeigt, dass die Hybrid-Cloud des CERN extrem gut geeignet ist, wenn es darum geht, die nötige Recheninfrastruktur für spezielle Aufgaben bereitzustellen. Darüber hinaus erfüllt eine gehostete Hybrid-Cloud-Lösung eine Reihe anderer CERN-Anforderungen, zum Beispiel:

  • Kosteneinsparungen durch ein Pay-for-Use-Modell
  • Einhaltung der europäischen Datenschutzbestimmungen
  • Mögliche Portierung relevanter Anwendungen in die Cloud
  • Umfangreiche Virtual-Machine-Funktionalität
  • Föderierter Identität und Single Sign-on
  • Skalierbarkeit durch erweiterbare Ressourcen, um wachsende Datenmengen zu bewältigen

Als Juwel der Teilchenphysik soll das CMS-Experiment, ein 14.000-Tonnen-Detektor, eine große Anzahl von Fragen rund um die Geheimnisse des Higgs-Bosons und dunkler Materie zu lösen. Jetzt, wo der LHC-Strahl während einer zweijährigen Betriebspause, genannt Long Shutdown 2 (LS2), ausgeschaltet ist, wird das CMS für signifikante Wartungsarbeiten und Upgrades vorbereitet. (Foto mit freundlicher Genehmigung des CERN)

Einzelheiten der Lösung
Eine Hybrid-Cloud-Lösung bietet CERN-Wissenschaftlern die Möglichkeit, wichtige Workloads an dem für die jeweilige Aufgabe idealen Ort zu platzieren.

Die bei CERN vor Ort verfügbaren Serverknoten werden, erweitert um ihre Rechenzentrumsanlagen in der Schweiz und in Budapest, über 10-Gigabit-Ethernet-Verbindung vernetzt. Gemeinsam profitieren diese Rechenzentrumsanlagen von Verarbeitungsgeschwindigkeit, die 15.000 Server und 230.000 Intel® Xeon® Prozessorkerne aus verschieden Generationen, einschließlich der neuesten skalierbaren Intel® Xeon® Prozessorreihe, bereitstellen. Eine Kombination aus Festplattenlaufwerken und Solid-State-Laufwerken (SSDs) bietet dem CERN das ideale Gleichgewicht zwischen Kosten pro Gigabyte und der für Echtzeit-Datenerfassung benötigten Geschwindigkeit.

Unterhalb der vor Ort installierten CERN-Hardware befindet sich eine optimierte OpenStack*-Softwarelösung. OpenStack wurde aufgrund der Flexibilität und Skalierbarkeit, die dem CERN damit zur Verfügung steht, gewählt. Das CERN-Team arbeitet zudem eng mit anderen Wissenschaftlern, die OpenStack in anderen Gegenden der Welt verwenden, zusammen. So können Teams Best Practices für Software-Optimierung teilen, die das Potenzial haben, auch für andere Forschungsinstitutionen von Vorteil zu sein.

Jeder der CSPs, der Datenanalysen und Simulationen für das CERN hostet, bietet die Infrastrukturflexibilität, um bei Bedarf zusätzliche Last zu bewältigen.

Hybrid-Cloud erweitert Vor-Ort-Infrastruktur für effiziente Aufgabenplatzierung
Nachdem das CERN-Team die LHC-Datenerfassungsphasen vor Jahren abgeschlossen hatte, musste es die Infrastrukturressourcen für den Datenanalyseprozess neu positionieren und optimieren. Die neuen gehosteten Lösungen des CERN verändern diesen Prozess, indem sie Simulationsaufgaben in der Cloud platzieren. Dieser Umstieg macht den Prozess einer neuen Bereitstellung überflüssig, bietet größere Skalierbarkeit und entlastet die vor Ort benötigte Rechenkapazität. Anstatt vor Ort in zusätzliche Hardware zu investieren, ermöglicht die große Anzahl virtueller Maschinen, die die Simulationsaufgaben des CERN ausführen, einen einfacheren, sicheren, elastischen und kostengünstigen Mechanismus, um diese Aufgabe zu bewältigen.

Hybrid-Cloud bietet hochskalierbare, kosteneffiziente Lösung für mehrere Workloads
Das CERN hat eine Budgetobergrenze, um zunehmend komplexe Arbeiten zu bewältigen. Da ihre künftigen LHC-Nutzungsszenarien noch größere Datenmengen erzeugen werden, benötigte das Team eine praktische, budgetbewusste Lösung. Gehostete Lösungen bieten ihnen nicht nur hochverfügbare Rechenressourcen und Datenspeicherkapazität, sondern auch die Elastizität, um mit den bei künftigen LHC-Szenarien erwarteten größeren Datenmengen des CERN parallel zu wachsen.

Spotlight auf CERN
Die in Genf ansässige Europäische Organisation für Kernforschung, die allgemeinhin als CERN bekannt ist, führt bahnbrechende wissenschaftliche Arbeiten durch, um die Zusammensetzung der Materie in unserem Universum zu studieren. Hierfür benötigt das CERN fortschrittliche Instrumente wie den größten Teilchenbeschleuniger der Welt, den Large Hadron Collider Der 27 Kilometer lange Ring des LHC ist mit Elektromagneten ausgestattet, mit denen die Teilchenstrahlen auf ihrer Bahn gehalten und beinahe bis auf Lichtgeschwindigkeit beschleunigt werden. Wenn atomare Teilchen innerhalb des Beschleunigers aufeinandertreffen, zerbrechen sie in ihre kleinsten Bestandteile. CERN-Forscher nutzen extrem sensible Detektoren, um Daten für weitere technische Studien zu beobachten und zu sammeln.

2012 mit dem Detektor Compact Muon Solenoid (CMS) bei einer Proton-Proton-Schwerpunktsenergie von 8 TeV aufgenommenes Ereignis. Das Ereignis zeigt Eigenschaften eines SM Higgs Bosons, das in zwei Photonen zerfällt (gestrichelte gelbe Linien und grüne Balken). (Abbildung mit freundlicher Genehmigung des CERN)

Erkenntnisse
Im Rahmen des RFP, Prototypprozesses und Testverfahrens der gehosteten Hybrid-Cloud-Lösungen machte das CERN-Team mehrere Beobachtungen, die anderen wissenschaftlichen Institutionen mit ähnlichen Anforderungen helfen können:

  • Anstatt selbst eine Hybrid-Cloud-Lösung aufzubauen, übergab das CERN-Team eine Liste von Anforderungen an CSPs und stellte es ihnen frei, die Lösung zu entwickeln, die diese Anforderungen am besten erfüllen würde.
  • Die Bandbreite zwischen CERN-Einrichtungen und den CSPs bleibt ein Schlüsselfaktor, der es auch weiterhin erforderlich macht, vor Ort Infrastruktur für die Echtzeit-Erfassung von LHC-Daten zu betreiben.
  • Wissenschaftler benötigen eine gemeinsame Schnittstelle für den Zugriff auf Daten vor Ort – oder in der Cloud.
  • Da Petabyte an LHC-Daten noch auf Jahrzehnte hinaus zugänglich sein müssen, wird als Ergänzung des kurzfristigen Datenspeicherbedarfs eine langfristige, kosteneffiziente Archivlösung benötigt.
  • Die Erweiterung einer ausschließlich intern betriebenen Lösung um eine gehostete Hybrid-Cloud-Lösung ist nicht nur eine technologische Herausforderung für die IT-Mitarbeiter, sondern erfordert auch einen kulturellen Wandel.

Lösungskomponenten

  • Skalierbare Intel Xeon Prozessorreihe

Weitere Informationen
Hybrid-Cloud: Kombination aus lokal und extern bereitgestellten Diensten ›
Private-Public-Cloud-Entscheidungen auf dem Weg zu einer Hybrid-Cloud treffen ›
Der Weg zu einer erfolgreichen Hybrid-Cloud-Implementierung ›

Informationen über zugehörige Produkte und Lösungen

Skalierbare Intel® Xeon® Prozessorreihe

Mit der skalierbaren Intel® Xeon® Plattform lassen sich nutzbringende Erkenntnisse einfacher gewinnen. Darüber hinaus bietet die Plattform hardwarebasierte Sicherheit und ermöglicht die dynamische Bereitstellung von Diensten.

Weitere Infos

Intel® Select Solutions

Stellen Sie eine vereinfachte Rechenzentrumsinfrastruktur zur Verfügung, die eine für unterschiedliche Aufgaben optimierte Konfiguration für schnelle und einfache Bereitstellung bietet.

Weitere Infos

Hinweise und Disclaimer

Durch Intel® Technik ermöglichte Funktionsmerkmale und Vorteile hängen von der Systemkonfiguration ab und können entsprechend geeignete Hardware, Software oder die Aktivierung von Diensten erfordern. Die Leistungsmerkmale variieren je nach Systemkonfiguration. Kein Computersystem bietet absolute Sicherheit. Informieren Sie sich beim Systemhersteller oder Einzelhändler oder auf https://www.intel.de. In Leistungstests verwendete Software und Workloads können speziell für die Leistungseigenschaften von Intel® Mikroprozessoren optimiert worden sein. Leistungstests wie SYSmark und MobileMark werden mit spezifischen Computersystemen, Komponenten, Softwareprogrammen, Operationen und Funktionen durchgeführt. Jede Veränderung bei einem dieser Faktoren kann abweichende Ergebnisse zur Folge haben. Für eine umfassende Bewertung Ihrer vorgesehenen Anschaffung, auch im Hinblick auf die Leistung des betreffenden Produkts in Verbindung mit anderen Produkten, sollten Sie zusätzliche Informationen und Leistungstests heranziehen.Ausführlichere Informationen finden Sie unter https://www.intel.de/benchmarks. Die Leistungsergebnisse basieren auf Tests, die zum Zeitpunkt, der in den Konfigurationen angegeben ist, durchgeführt wurden und berücksichtigen möglicherweise nicht alle öffentlich verfügbaren Sicherheitsupdates. Weitere Einzelheiten finden Sie in den veröffentlichten Konfigurationsdaten. Kein Produkt und keine Komponente bieten absolute Sicherheit. // Die beschriebenen Kostensenkungsszenarien sind als Beispiele dafür gedacht, wie ein bestimmtes Produkt mit Intel®-Technik unter den genannten Umständen und in der angegebenen Konfiguration zukünftige Kosten beeinflussen und Einsparungen ermöglichen kann. Die Umstände unterscheiden sich von Fall zu Fall. Intel übernimmt keine Gewähr für Kosten oder Kostensenkungen. // Intel hat keinen Einfluss auf und keine Aufsicht über die Benchmarkdaten Dritter oder die Websites, auf die in diesem Dokument Bezug genommen wird. Besuchen Sie die genannten Websites, um sich davon zu überzeugen, dass die angeführten Benchmarkdaten zutreffen. // Bei einigen Tests wurden die Ergebnisse unter Verwendung interner Analysen oder Architektursimulationen bzw. -modellen von Intel geschätzt oder nachempfunden. Sie dienen nur informatorischen Zwecken. Unterschiede in der Hardware, Software oder Konfiguration des Systems können die tatsächliche Leistung beeinflussen.