IMS: Durchbrüche in den Molekularwissenschaften

Das Institute for Molecular Science hat ein neues HPC-System eingeführt, umMassenparallel-Rechenvorgänge und Hochgeschwindigkeitsberechnungen zu unterstützen.

Auf einen Blick:

  • Japans Institute for Molecular Science (IMS) ermöglicht Forschern im In- und Ausland, gemeinsam an Projekten zu arbeiten und Ergebnisse auszutauschen.

  • Die beiden Systeme des Molecular Simulator verwenden skalierbare Intel® Xeon® Prozessoren und Intel® SSDs für Massenparallel-Rechenvorgänge und für die nötige Geschwindigkeit bei anspruchsvollen seriellen Operationen.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Kurzübersicht
Das Institut for Molecular Science (IMS) hat seine Rechenfähigkeiten durch ein Mehrzwecksystem deutlich erweitert, das Forschern dienen soll, die leistungsfähige Parallelverarbeitung und speicherintensive serielle Verarbeitung benötigen. Das neue System basiert auf Intel® Xeon® Gold 6148 Prozessoren und Intel® Xeon® Gold 6154 Prozessoren mit 800 GB Intel® SSDs der Produktreihe DC 3520, die alle über die Intel® Omni-Path-Architektur (Intel® OPA) verbunden sind.

Herausforderung
Japans Institute for Molecular Science ist ein Zentrum für komplexe Forschungsprojekte in den Molekularwissenschaften – sowohl theoretische als auch experimentelle. IMS hat vier Forschungsbereiche: Theoretische und computergestützte Molekularwissenschaft, Foto-Molekularwissenschaft, Material-Molekularwissenschaft und Biologie und Koordination – Komplexe Molekularwissenschaft. Die Organisation bietet einen Ort für gemeinsame Forschung in Molekularwissenschaft und ist an in- und ausländischen Austauschprogrammen beteiligt. IMS-Wissenschaftler arbeiten auch mit einer Reihe von Forschern aus Japan und der ganzen Welt zusammen und unterstützen wichtige Durchbrüche in der Molekularwissenschaft. Die IMS-Supercomputer wurden für wichtige Aufgaben wie quantenchemische Berechnungen, Bandberechnungen und molekulardynamische Simulationen verwendet. Aktuelle Arbeiten erschienen in wissenschaftlichen Zeitschriften wie Nature (25. Februar 2016, vol. 530, pp. 465–468).

„Die größte Herausforderung für echte Forschunsdurchbrüche liegt in der riesigen Anzahl von Trial-and-Error-Berechnungen, die Forscher auf unseren Supercomputern ausführen müssen, um neuartige Strukturen und Verhaltensweisen zu finden.“ —Shinji Saito, Leiter des Research Center for Computational Science (RCCS) bei IMS

Während die Molekulardynamik-Simulationen (MD) in der Regel stark für die parallele Bearbeitung optimiert sind, werden viele QC-Algorithmen (Quantenchemie) seriell ausgeführt. Bei beiden Arten der Bearbeitung führen die großen Probleme, die die Wissenschaftler untersuchen, zu langen Laufzeiten, um die benötigten Daten zu sammeln. IMS bietet Forschern genügend CPU-Zeit, um solche Herausforderungen zu lösen, unabhängig davon, ob sie serielle oder parallele Berechnungen durchführen.

„Unsere vorherigen Supercomputer wurden 2011 installiert“, erklärte Saito. „Sie verwendeten also sechs Jahre alte Technologien. Die Anzahl der Kerne und die Geschwindigkeit von Berechnungen reichten für unsere Benutzer von heute nicht mehr aus.“

Lösung
MD-Berechnungen können gleichzeitig Tausende von Kernen verwenden. Mehr Kerne bei einer nicht-blockierenden Verbindung ermöglichen es Forschern, ihre Aufgaben wesentlich schneller auszuführen oder im Vergleich zu Systemen mit weniger Kernen viel größere Aufgaben auszuführen. Aber die seriellen Prozesse von QC erfordern massive Mengen an Arbeitsspeicher mit den höchsten CPU-Taktfrequenzen, um schnell zu Ergebnissen zu kommen.

„Da IMS Forschungsprojekte mit beiden Arten der Berechnung unterstützt und da CPU-Taktfrequenzen bei Systemen mit mehr Kernen normalerweise niedriger sind, benötigten wir eine Lösung, die beide Konfigurationen zu bieten hat – ein System mit Tausenden von Kernen und eines mit weniger, aber schnelleren Kernen und großem Arbeitspeicher." —Fumiyasu Mizutani, Section Chief, RCCS

IMS hat mit NEC* zusammengearbeitet, um zwei Cluster mit Supermicro* Servern zu installieren, die durch Intel® Omni-Path-Architektur (Intel® OPA) miteinander verbunden sind. Die neue Maschine wird als High Performance Molecular Simulator bezeichnet. Sie erreichte im November 2017 Platz 70 der Top500-Liste, mit 1,8 petaFLOPS LINPACK* und 3.1 petaFLOPS theoretischer Spitzenleistung.1. Bei IMS wurde sie am 1. Oktober 2017 aktiviert.

Die beiden Systeme des Molecular Simulator verwenden Intel® Xeon® Gold 6148 Prozessoren mit 20 Kernen für MD-Massenparallel-Rechenvorgänge, während Intel® Xeon® Gold 6154 Prozessoren mit 18 Kernen mit einer Taktfrequenz von 3,0 bis 3,7 GHz (Turbo) die nötige Geschwindigkeit für die anspruchsvolleren seriellen QCF-Berechnungen liefern. Um den Anforderungen unterschiedlicher Arten von Workloads gerecht zu werden, wurden die 20-Kern-Knoten in einer vollen bi-sektionalen Bandbreite (FBB) konfiguriert, während die schnelleren Knoten 1:3 überzeichnet wurden, da sie während ihrer speicherintensiven Aufgaben nicht so viel kommunizieren würden.

Der Molecular Simulator verwendet außerdem 800 GB Intel® SSDs der Produktreihe DC 3520.

Ergebnisse
Seit der Einführung des Molecular Simulators hat er viele Benchmarks durchgeführt, die Berechnungen der Quantenchemie, Simulationen in der molekularen Dynamik, Speicherübertragung und Datenspeicher-Testprogramme umfassten. Darüber hinaus haben Anwender damit begonnen, ihre neuen Forschunsgprojekte auf dem System laufen zu lassen. Ein Benchmarking eines modifizierten Tests397 - eine Geometrieoptimierung und Frequenzberechnung mit Gaussian09 Rev.d01 - ist auf dem neuen System ungefähr 2,1-mal schneller als im alten System.2 Das neue System mit 40.588 Kernen liefert 7,3-mal die Rechenkapazität des vorherigen Systems.2

„Während die Gaussian-Benchmarkergebnisse dieser speicherintensiven Workload vor der Anwendung von Softwaremaßnahmen wie Spectre und Meltdown und Firmware-Updates berechnet wurden“, so Mizutani, „zeigten weitere Tests des Codes keine Leistungseinschränkungen nach Anwedung der Sicherheitsupdates.“

Jetzt laufen etwa 1000 Jobs von 80 aktiven Anwendern konstant und effizient auf dem System unter Verwendung von einer Anzahl von 1 bis zu 1000 Kernen,

Zusammenfassung
Das IMS unterstützt mit seinem neuen High Performance Molecular Simulator ein breites Spektrum von Forschungsaufgaben im Bereich der Molekularwissenschaften, wie das wissenschaftliche Rechnen. Das neue System bietet High-Performance-Computing (HPC) sowohl für Massenparallelrechenprozesse als auch für serielle Hochgeschwindigkeitsberechnungen mit hohem Arbeitsspeicherbedarf. Es umfasst 40.588 Kerne von sowohl Intel® Xeon® Gold 6154 Prozessoren als auch Intel® Xeon® Gold 6148 Prozessoren, die durch die Intel® Omni-Path-Architektur (Intel® OPA) miteinander verbunden sind. In der Top-500-Liste vom November 2017 belegte das System Rang 70.

Lösungskonfiguration

  • 40.588 Kerne von Intel® Xeon® Gold 6148 Prozessoren und Intel® Xeon® Gold 6154 Prozessoren
  • Intel® Omni-Path-Architektur (Intel® OPA) Fabric
  • Intel® SSDs der Produktreihe DC 3520
  • 216,768 GB RAM

Hinweise und Disclaimer

Durch Intel® Technik ermöglichte Funktionsmerkmale und Vorteile hängen von der Systemkonfiguration ab und können entsprechend geeignete Hardware, Software oder die Aktivierung von Diensten erfordern. Die Leistungsmerkmale variieren je nach Systemkonfiguration. Kein Computersystem bietet absolute Sicherheit. Informieren Sie sich beim Systemhersteller oder Einzelhändler oder auf https://www.intel.de. In Leistungstests verwendete Software und Workloads können speziell für die Leistungseigenschaften von Intel® Mikroprozessoren optimiert worden sein. Leistungstests wie SYSmark und MobileMark werden mit spezifischen Computersystemen, Komponenten, Softwareprogrammen, Operationen und Funktionen durchgeführt. Jede Veränderung bei einem dieser Faktoren kann abweichende Ergebnisse zur Folge haben. Für eine umfassende Bewertung Ihrer vorgesehenen Anschaffung, auch im Hinblick auf die Leistung des betreffenden Produkts in Verbindung mit anderen Produkten, sollten Sie zusätzliche Informationen und Leistungstests heranziehen.Ausführlichere Informationen finden Sie unter https://www.intel.de/benchmarks. Die Leistungsergebnisse basieren auf Tests, die zum Zeitpunkt, der in den Konfigurationen angegeben ist, durchgeführt wurden und berücksichtigen möglicherweise nicht alle öffentlich verfügbaren Sicherheitsupdates. Weitere Einzelheiten finden Sie in den veröffentlichten Konfigurationsdaten. Kein Produkt und keine Komponente bieten absolute Sicherheit. // Die beschriebenen Kostensenkungsszenarien sind als Beispiele dafür gedacht, wie ein bestimmtes Produkt mit Intel®-Technik unter den genannten Umständen und in der angegebenen Konfiguration zukünftige Kosten beeinflussen und Einsparungen ermöglichen kann. Die Umstände unterscheiden sich von Fall zu Fall. Intel übernimmt keine Gewähr für Kosten oder Kostensenkungen. // Intel hat keinen Einfluss auf und keine Aufsicht über die Benchmarkdaten Dritter oder die Websites, auf die in diesem Dokument Bezug genommen wird. Besuchen Sie die genannten Websites, um sich davon zu überzeugen, dass die angeführten Benchmarkdaten zutreffen. // Bei einigen Tests wurden die Ergebnisse unter Verwendung interner Analysen oder Architektursimulationen bzw. -modellen von Intel geschätzt oder nachempfunden. Sie dienen nur informatorischen Zwecken. Unterschiede in der Hardware, Software oder Konfiguration des Systems können die tatsächliche Leistung beeinflussen.

Produkt- und Leistungsinformationen

1

NEC LX Cluster, Intel® Xeon® Gold 6148/6154 Prozessor, Intel® Omni-Path-Architektur (Intel® OPA) mit 40.558 Kernen und einer theoretischen Höchstleistung von 3.1 petaFLOPS.

2

Fujitsu PRIMERGY* CX250 und RX300, Intel® Xeon® E5-2690/E5-2697v3 Prozessor 2,9 GHz/2,6 Ghz, InfiniBand FDR/QDR mit 12.992 Kernen und einer theoretischen Leistung von .437427 petaFLOPS gemäß https://www.top500.org/site/48473. Die Leistungsergebnisse basieren auf Tests vom 06.08.2018 und spiegeln möglicherweise nicht alle öffentlich erhältlichen Sicherheitsupdates wider.