Kurzübersicht:
Als führende Technische Universität im spanischen Sprachraum benötigte die Universidad Politécnica de Madrid (UPM) Supercomputer-Leistung einer neuen Generation, um die laufende Forschung im Bereich der wissenschaftlichen Anwendung von Computertechnik an der Universität zu unterstützen. Der bereits 2011 installierte Magerit-2-Supercomputer auf Basis der IBM-Power-Architektur wurde durch Magerit-3 ersetzt, einem Cluster bestehend aus Lenovo-ThinkSystem-Servern mit Intel® Xeon® Gold Prozessoren 6230 und insgesamt 2920 Kernen. Der neue Supercomputer wurde im September 2019 installiert.
Herausforderung
Die Universidad Politécnica de Madrid (UPM) (Polytechnische Universität Madrid) besteht aus vielen Fakultäten in den Bereichen Ingenieurwesen, Architektur, Informatik und anderen, mit über 40.000 Studenten in Grund- und Aufbaustudiengängen sowie Doktorandenprogrammen. Im Jahr 2004 erweiterte die UPM ihre Ressourcen für die Forschung durch die Einrichtung des Centro de Supercomputación y Visualización de Madrid (CeSViMa) (Supercomputing- und Visualisierungs-Center Madrid), das High-Performance-Computing (HPC) und interaktive Visualisierung mit spezialisierter Software für technische Disziplinen sowie Energie und Umwelt bereitstellt. Laut Oscar Cubo Medina, dem technischen Direktor des CeSViMa, bietet das Center allen Fakultäten der UPM sowie Wissenschaftlern in angeschlossenen Forschungseinrichtungen, wie dem Instituto de Fusión Nuclear, einem Forschungszentrum an der UPM für Kernfusion, Kernspaltung und hochenergetische Anregung, und dem Instituto de Energía Solar, das neuartige Materialien für effizientere und möglichst kostengünstige Solarpanels untersucht, Supercomputing-Dienste.
Das CeSViMa beherbergt einen der leistungsfähigsten Supercomputer in Spanien, den „Magerit“. „Magerit“ ist an den ursprünglichen, vermutlich aus dem Arabischen stammenden Namen von Madrid angelehnt, der die ungefähre Bedeutung Kanal, Wasserleitung oder Flussbett hat. Der Magerit hat in drei Phasen über ein Jahrzehnt lang HPC- und allgemeine Datenverarbeitungsdienste bereitgestellt. Magerit-1 wurde 2006 von IBM auf Basis der Power-Architektur des Unternehmens entwickelt. Magerit-2 erweiterte die Leistungseigenschaften des Supercomputers im Jahr 2011. Magerit-3 wurde im September 2019 installiert.
Seit Magerit-2 in Betrieb genommen wurde, haben einige Forscher an der UPM ihre Methoden und die Berechnungsanforderungen in einem Umfang weiterentwickelt, der nunmehr die Kapazitäten ihrer HPC-Ressourcen übersteigt. Eduardo Oliva Gonzalo forscht als Postdoktorand am Instituto de Fusión Nuclear. Er untersucht die Wechselwirkung von Laserstrahlen und Plasma und interessiert sich besonders für die Verstärkung im Röntgenbereich.
„Diese Art der Forschung ist mit kleinen Clustern nicht möglich“, so Oliva Gonzalo. Er hatte mit viel kleineren Rechensystemen gearbeitet, einschließlich selbstgebauten Beowulf-Clustern. „Die Aufgaben, vor denen ich stehe, umfassen mehrere Größenordnungen. Ich muss Plasmas im Millimeter- oder Zentimeterbereich simulieren, aber mit hoher Auflösung (bis in den zweistelligen Nanometerbereich). Dazu braucht man HPC.“
Die Forscherkollegen Antonio Rivera und Ovidio Peña Rodríguez nutzen HPC-Simulationen, um plasmonische Nanopartikel und die Auswirkungen intensiver Elektronenanregung auf Materialien zu erforschen, die insbesondere in Nuklearanlagen verwendet werden. Sie verwenden eine Reihe von physikalischen und molekulardynamischen Programmen, die rechenintensiv sind.
„In der Vergangenheit konnten unsere Supercomputing-Simulationen bis zum Abschluss eine Woche dauern“, erklärte Rivera.
„Einige der Berechnungen, die wir benötigen, konnten mit Magerit-2 nicht durchgeführt werden“, fügte Peña Rodríguez hinzu.
Weitere Forscher, wie Pablo Palacios und Pablo Sanchez-Palencia vom Instituto de Energía Solar, brauchen Supercomputing für die theoretische Modellierung neuer, aus Perowskiten bestehender Materialien für Photovoltaikanlagen. Perowskite gelten als die Zukunft der Solartechnik. Aus Perowskiten bestehende Solarzellen sind billiger und einfacher herzustellen als auf Silizium basierende, aber weniger stabil. Palacios und Sanchez-Palencia arbeiten an der Untersuchung neuer Kombinationen von Perowskiten mit verschiedenen Metallen, um stabilere Photovoltaikelemente zu erhalten.
Angesichts der Fortschritte in den Forschungsbereichen sowie bei den Simulationsprogrammen und -prozessen war es 2018 Zeit für einen neuen Magerit.
Lösung
Magerit-3 wurde von Lenovo mit seinen Zweiprozessorservern ThinkSystem SD530 aufgebaut. Bei insgesamt 68 ThinkSystem SD530 stehen 2920 Kerne in Intel Xeon Gold Prozessoren 6230 zur Verfügung. Magerit-3 liefert 182,78 TeraFLOPS Rpeak-Leistung.
„Wir sind wahrscheinlich einer der größten Nutzer von Magerit“, so José Manuel Perlado, Vorsitzender der Kernphysik und Direktor des Instituto Fusión Nuclear. „Wir arbeiten hauptsächlich im Bereich der Kernspaltung und der Kernfusion, aber viele unserer Programme und Forschungen lassen sich auf andere Bereiche übertragen, in denen physikalische Prozesse mit hoher Energiedichte untersucht werden müssen.“
Perlado zufolge setzen die Forscher viele sehr rechenintensive Programme ein, die sowohl eine große Verarbeitungskapazität als auch große Arbeitsspeicher erfordern. Einige Programme können nicht parallelisiert werden. Magerit-3 ist laut Perlado maßgeblich dafür verantwortlich, die Forschung von Wissenschaftlern am Institut voranzubringen.
Ablauf der Perowskite-Analyse – von der Kristallstruktur bis zu den optischen Eigenschaften. Die ersten Schritte zur Entwicklung effizienter Solarmodule. (Abbildung mit freundlicher Genehmigung der IES-Gruppe, UPM)
Zusammenfassung
Um die fortgeschrittenen Forschungsarbeiten der Wissenschaftler am UPM sowie der angeschlossenen Forschungseinrichtungen und anderer Einrichtungen in Spanien zu unterstützen, musste die Universität für HPC-Verarbeitungskapazitäten der nächsten Generation sorgen. Im September 2019 wurde Magerit-3, ein auf Lenovo-Servern des Typs ThinkSystem SD530 mit Intel Xeon Gold Prozessoren 6230 basierender Supercomputer mit 2920 Kernen, installiert und in Betrieb genommen. Und laut Aussagen der Universität liefert er knapp 183 TeraFLOPS Supercomputing-Leistung, was die Programme 5-mal schneller macht. 1
Vom Centro de Supercomputación y Visualización de Madrid (CeSViMa) verwalteter Supercomputer Magerit-3. (Foto mit freundlicher Genehmigung der UPM)
Lenovo und Intel kooperieren, um das Zusammenwachsen von HPC und KI zu beschleunigen und dadurch Lösungen jeglicher Größenordnung zu ermöglichen, die für Kunden neue Erkenntnishorizonte eröffnen. Durch die Zusammenarbeit bei Systemen und Lösungen, der Softwareoptimierung und der Unterstützung des Technologieumfelds sollen Entdeckungen und Ergebnisse für die herausforderndsten Probleme der Welt in der Exascale-Ära und darüber hinaus schneller verfügbar sein. Lenovo-Server, die bevorzugt für die schnellsten TOP500-Supercomputer eingesetzten Systeme, basieren auf skalierbaren Intel Xeon Prozessormodellen und Intels marktführender Technik für Massenspeicher, Arbeitsspeicher und Software als innovativer Grundlage für noch schnellere Fortschritte in Wissenschaft und Industrie.
Lösungskomponenten
- Konfiguriert von Lenovo mit 68 Zweiprozessorservern des Typs ThinkSystem SD530
- Intel Xeon Gold Prozessoren 6230 mit je 20 Kernen (2920 Kerne insgesamt)
- 192 GB Arbeitsspeicher, 480 GB Intel SSDs pro Knoten (13.056 PB insgesamt)
- 182,78 TFLOPS Rpeak-Leistung