CERN: Hybrid-Cloud ermöglicht bahnbrechende Forschung

Wissenschaftler nutzen den weltweit größten Teilchenbeschleuniger und Intel® Technik, um die Zusammensetzung des Universums zu verstehen.

Auf einen Blick:

  • Das CERN untersucht die subatomaren Bausteine, die alles im Universum ausmachen.

  • CERN's Large Hadron Collider (LHC) ist der größte Teilchenbeschleuniger der Welt. Sekündlich erfassen extrem sensible Detektoren Petabyte an Daten, die bei jeder Versuchsreihe, die mit dem HHC ausgeführt wird, entstehen. Infolge von Bandbreiteneinschränkungen erfolgt der LHC-Datenerfassungsprozess in den Rechenzentren des CERN, die für diese Aufgabe ausgelegt und mit der skalierbaren Intel® Xeon® Prozessorreihe ausgestattet sind.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Kurzübersicht:

Im CERN, der Europäische Organisation für Kernforschung, werden die subatomaren Bausteine studiert, die alles im Universum umfassen. Der Large Hadron Collider (LHC) ist der größte Teilchenbeschleuniger der Welt. Er besteht aus einem Ring mit 27 Kilometer Umfang, in dem zwei Strahlen aus subatomaren Teilchen in gegenläufiger Richtung auf beinahe Lichtgeschwindigkeit beschleunigt werden. Wenn die Strahlen aufeinandertreffen, zersplittern die Teilchen in ihre elementarsten Komponenten. Detektoren erfassen riesige Mengen an Echtzeit-Daten, die beim Aufprall generiert werden. Die Daten werden anschließend gespeichert und mithilfe der Hybrid-Cloud-Lösung des CERN mittels Data-Mining auf Erkenntnisse untersucht.

Herausforderung

Ironischerweise erfordert das Verständnis der kleinsten Teilchen unseres Universums enorme Rechenleistung, um aus den umfangreichen Datenmengen Erkenntnisse abzuleiten. Sekündlich erfassen hochsensible Detektoren Petabyte an Daten, die bei jeder Versuchsreihe, die mit dem HHC ausgeführt wird, entstehen. Obwohl ein Filterprozess diese Menge reduziert, verbleiben immer noch Gigabyte an Daten, die vor Ort in Echtzeit erfasst und gespeichert werden müssen. Als Ergänzung der internen Infrastruktur benötigt das CERN eine schnelle, skalierbare und budgetschonende Rechen- und Datenspeicherlösung für die Simulation und Modellierung der resultierenden Daten.

Lösung

Da die Bandbreite zwischen den Cloud-Service-Providern (CSPs) und der CERN-Einrichtung praktische Grenzen hat, verbleibt der Datenerfassungprozess des LHC lokal in den CERN-eigenen Rechenzentren, die für diese Aufgabe ausgelegt sind. Nach der Datensammlungsphase verwalten die gehosteten Cloud-Lösungen den Datenauswertungsprozess des CERN. Zwei CSPs designten Speziallösungen für die CERN-Spezifizierungen im Bereich Datenspeicher, Sicherheit, Leistung und Hosting von Anwendungen. Beide CSPs stellten erweiterbar Virtual-Machine-Funktionalität (VM) und umfangreichen Datenspeicher bereit, um die Modellierung und Simulation von LHC-Daten zu erleichtern.

Large-Hadron-Collider-Tunnel im CERN (Foto mit freundlicher Genehmigung von CERN)

Ergebnisse

Beide CSPs bauten und testeten einen für die CERN-Anforderungen maßgeschneiderten Hybrid-Cloud-Prototypen. Jede gehostete Lösung bietet die Datenspeicher-, Verarbeitungs- und Vernetzungsgeschwindigkeit, die das CERN heute benötigt, und einen optimierten Wachstumspfad für künftige Anforderungen. Da sich die gehostete Cloud-Lösung, sofern sie nicht gerade vom CERN verwendet wird, von anderen Forschungsorganisationen in Europa für andere Zwecke einsetzen lässt, ist die finanzielle Investition für eine vielfältige Gruppe von Wissenschaftlern von Vorteil. Die Hybrid-Cloud sorgt so für breitgefächerten Nutzen und ein besseres Preis-Leistungs-Verhältnis.

Unser Team sucht ständig nach Möglichkeiten für die Optimierung und Beschleunigung unserer Infrastruktur. Daher sind Hybrid-Cloud-Lösungen für unsere Arbeit extrem wichtig. Unsere Aufgabe ist es sicherzustellen, dass die IT die Physik nicht einschränkt.“ – Tim Bell, Compute and Monitoring Group Leader, IT Department, CERN

Die Hybrid-Cloud ebnet den Weg für umfangreiche Simulationen und spezielle Anforderungen

Es hat sich gezeigt, dass die Hybrid-Cloud des CERN extrem gut geeignet ist, wenn es darum geht, die nötige Recheninfrastruktur für spezielle Aufgaben bereitzustellen. Darüber hinaus erfüllt eine gehostete Hybrid-Cloud-Lösung eine Reihe anderer CERN-Anforderungen, zum Beispiel:

  • Kosteneinsparungen durch ein Pay-for-Use-Modell
  • Einhaltung der europäischen Datenschutzbestimmungen
  • Mögliche Portierung relevanter Anwendungen in die Cloud
  • Umfangreiche Virtual-Machine-Funktionalität
  • Föderierter Identität und Single Sign-on
  • Skalierbarkeit durch erweiterbare Ressourcen, um wachsende Datenmengen zu bewältigen

Als Juwel der Teilchenphysik soll das CMS-Experiment, ein 14.000-Tonnen-Detektor, eine große Anzahl von Fragen rund um die Geheimnisse des Higgs-Bosons und dunkler Materie zu lösen. Jetzt, wo der LHC-Strahl während einer zweijährigen Betriebspause, genannt Long Shutdown 2 (LS2), ausgeschaltet ist, wird das CMS für signifikante Wartungsarbeiten und Upgrades vorbereitet. (Foto mit freundlicher Genehmigung des CERN)

Einzelheiten der Lösung

Eine Hybrid-Cloud-Lösung bietet CERN-Wissenschaftlern die Möglichkeit, wichtige Workloads an dem für die jeweilige Aufgabe idealen Ort zu platzieren.

Die bei CERN vor Ort verfügbaren Serverknoten werden, erweitert um ihre Rechenzentrumsanlagen in der Schweiz und in Budapest, über 10-Gigabit-Ethernet-Verbindung vernetzt. Gemeinsam profitieren diese Rechenzentrumsanlagen von Verarbeitungsgeschwindigkeit, die 15.000 Server und 230.000 Intel® Xeon® Prozessorkerne aus verschieden Generationen, einschließlich der neuesten skalierbaren Intel® Xeon® Prozessorreihe, bereitstellen. Eine Kombination aus Festplattenlaufwerken und Solid-State-Laufwerken (SSDs) bietet dem CERN das ideale Gleichgewicht zwischen Kosten pro Gigabyte und der für Echtzeit-Datenerfassung benötigten Geschwindigkeit.

Unterhalb der vor Ort installierten CERN-Hardware befindet sich eine optimierte OpenStack*-Softwarelösung. OpenStack wurde aufgrund der Flexibilität und Skalierbarkeit, die dem CERN damit zur Verfügung steht, gewählt. Das CERN-Team arbeitet zudem eng mit anderen Wissenschaftlern, die OpenStack in anderen Gegenden der Welt verwenden, zusammen. So können Teams Best Practices für Software-Optimierung teilen, die das Potenzial haben, auch für andere Forschungsinstitutionen von Vorteil zu sein.

Jeder der CSPs, der Datenanalysen und Simulationen für das CERN hostet, bietet die Infrastrukturflexibilität, um bei Bedarf zusätzliche Last zu bewältigen.

Hybrid-Cloud erweitert Vor-Ort-Infrastruktur für effiziente Aufgabenplatzierung

Nachdem das CERN-Team die LHC-Datenerfassungsphasen vor Jahren abgeschlossen hatte, musste es die Infrastrukturressourcen für den Datenanalyseprozess neu positionieren und optimieren. Die neuen gehosteten Lösungen des CERN verändern diesen Prozess, indem sie Simulationsaufgaben in der Cloud platzieren. Dieser Umstieg macht den Prozess einer neuen Bereitstellung überflüssig, bietet größere Skalierbarkeit und entlastet die vor Ort benötigte Rechenkapazität. Anstatt vor Ort in zusätzliche Hardware zu investieren, ermöglicht die große Anzahl virtueller Maschinen, die die Simulationsaufgaben des CERN ausführen, einen einfacheren, sicheren, elastischen und kostengünstigen Mechanismus, um diese Aufgabe zu bewältigen.

Hybrid-Cloud bietet hochskalierbare, kosteneffiziente Lösung für mehrere Workloads

Das CERN hat eine Budgetobergrenze, um zunehmend komplexe Arbeiten zu bewältigen. Da ihre künftigen LHC-Nutzungsszenarien noch größere Datenmengen erzeugen werden, benötigte das Team eine praktische, budgetbewusste Lösung. Gehostete Lösungen bieten ihnen nicht nur hochverfügbare Rechenressourcen und Datenspeicherkapazität, sondern auch die Elastizität, um mit den bei künftigen LHC-Szenarien erwarteten größeren Datenmengen des CERN parallel zu wachsen.

Spotlight auf CERN

Die in Genf ansässige Europäische Organisation für Kernforschung, die allgemeinhin als CERN bekannt ist, führt bahnbrechende wissenschaftliche Arbeiten durch, um die Zusammensetzung der Materie in unserem Universum zu studieren. Hierfür benötigt das CERN fortschrittliche Instrumente wie den größten Teilchenbeschleuniger der Welt, den Large Hadron Collider Der 27 Kilometer lange Ring des LHC ist mit Elektromagneten ausgestattet, mit denen die Teilchenstrahlen auf ihrer Bahn gehalten und beinahe bis auf Lichtgeschwindigkeit beschleunigt werden. Wenn atomare Teilchen innerhalb des Beschleunigers aufeinandertreffen, zerbrechen sie in ihre kleinsten Bestandteile. CERN-Forscher nutzen extrem sensible Detektoren, um Daten für weitere technische Studien zu beobachten und zu sammeln.

2012 mit dem Detektor Compact Muon Solenoid (CMS) bei einer Proton-Proton-Schwerpunktsenergie von 8 TeV aufgenommenes Ereignis. Das Ereignis zeigt Eigenschaften eines SM Higgs Bosons, das in zwei Photonen zerfällt (gestrichelte gelbe Linien und grüne Balken). (Abbildung mit freundlicher Genehmigung des CERN)

Erkenntnisse

Im Rahmen des RFP, Prototypprozesses und Testverfahrens der gehosteten Hybrid-Cloud-Lösungen machte das CERN-Team mehrere Beobachtungen, die anderen wissenschaftlichen Institutionen mit ähnlichen Anforderungen helfen können:

  • Anstatt selbst eine Hybrid-Cloud-Lösung aufzubauen, übergab das CERN-Team eine Liste von Anforderungen an CSPs und stellte es ihnen frei, die Lösung zu entwickeln, die diese Anforderungen am besten erfüllen würde.
  • Die Bandbreite zwischen CERN-Einrichtungen und den CSPs bleibt ein Schlüsselfaktor, der es auch weiterhin erforderlich macht, vor Ort Infrastruktur für die Echtzeit-Erfassung von LHC-Daten zu betreiben.
  • Wissenschaftler benötigen eine gemeinsame Schnittstelle für den Zugriff auf Daten vor Ort – oder in der Cloud.
  • Da Petabyte an LHC-Daten noch auf Jahrzehnte hinaus zugänglich sein müssen, wird als Ergänzung des kurzfristigen Datenspeicherbedarfs eine langfristige, kosteneffiziente Archivlösung benötigt.
  • Die Erweiterung einer ausschließlich intern betriebenen Lösung um eine gehostete Hybrid-Cloud-Lösung ist nicht nur eine technologische Herausforderung für die IT-Mitarbeiter, sondern erfordert auch einen kulturellen Wandel.

Lösungskomponenten

  • Skalierbare Intel Xeon Prozessoren

Weitere Informationen

Hybrid-Cloud: Kombination aus lokal und extern bereitgestellten Diensten ›
Der Weg zu einer erfolgreichen Hybrid-Cloud-Implementierung ›

PDF herunterladen ›

Informationen über zugehörige Produkte und Lösungen