University of Delhi betreibt Forschung im Bereich Pflanzengenomik

Ein Lenovo HPC-System mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation beschleunigt die Erkenntnisgewinnung.

Auf einen Blick:

  • Die University of Delhi ist eine der größten und renommiertesten Einrichtungen der höheren Bildung Indiens. Das Institut für Genetik (Department of Genetics) der Universität hat sich zu einem wichtigen Zentrum für Lehre und Forschung in den Bereichen Genetik, Genomik und Molekularbiologie entwickelt.

  • Um die wichtige Forschung an Brassica-Ölsaaten zu beschleunigen, entschied sich das Zentrum für die genetische Manipulation von Kulturpflanzen (Centre for Genetic Manipulation of Crop Plants), in seine eigene dedizierte HPC-Infrastruktur zu investieren. In enger Zusammenarbeit mit Lenovo installierte man zwei Lenovo ThinkSystem-Server, die jeweils mit acht Intel® Xeon® Platinum 8260 CPUs ausgestattet wurden, sowie ein Network File System, das auf einem hybriden Datenspeicher-Array von Lenovo ThinkSystem basiert.

author-image

Von

Hintergrund

Mit über 62.000 Studenten ist die University of Delhi eine der größten und renommiertesten Hochschuleinrichtungen Indiens. Seit seiner Gründung im Jahr 1984 hat sich das Institut für Genetik der Universität zu einem wichtigen Zentrum für Lehre und Forschung in den Bereichen Genetik, Genomik und Molekularbiologie entwickelt.

Das Institut ist international für die Arbeit seiner Wissenschaftler in den Bereichen Pflanzen- und Humangenetik, Pflanzenzüchtung, Verbesserung von Nutzpflanzen und Pflanzengesundheit anerkannt. Die Humangenetiker an der Universität Delhi führen Omics-Analysen (z. B. Genomics, Transcriptomics) durch, um die genetischen Grundlagen verschiedener Humanerkrankungen zu verstehen, darunter Schizophrenie, Parkinson und rheumatoide Arthritis. Das Zentrum für die genetische Manipulation von Kulturpflanzen (Centre for Genetic Manipulation of Crop Plants, CGMCP) wurde 1996 am Süd-Campus der Universität Delhi mit Mitteln des National Dairy Development Board (NDDB) gegründet.

Seit seiner Gründung besteht eine der Hauptaufgaben des CGMCP darin, die Produktivität von Sareptasenf (Brassica juncea) zu verbessern. Diese Nutzpflanze wird in den Trockengebieten des indischen Subkontinents viel angebaut und dient als Quelle von Speiseöl für den menschlichen Verzehr und Schrotmehl als Futtermittel.

Kürzlich haben Wissenschaftler am CGMCP damit begonnen, Omics-Ansätze einzusetzen, um mehr über die Interaktionen zwischen Pflanze und Pathogenen sowie die Faktoren zu erfahren, die bei verschiedenen Varianten der Spezies zu hohen Erträgen führen.

Herausforderung

Am Institut für Genetik der University of Delhi werden jährlich Dutzende von neuen Forschungsprojekten gestartet. Daher besteht extrem großer Bedarf an Ressourcen für High-Performance-Computing (HPC). Das Institut betreibt einen zentralen HPC-Cluster, auf den alle Mitglieder der Fakultät zugreifen können. Oft kam es aber bei essenziellen Computerressourcen zu langen Wartezeiten.

Um die wichtige Forschung zu Ölnutzpflanzen zu beschleunigen, entschied sich das CGMCP für die Investition in eine eigene dedizierte HPC-Infrastruktur. Das CGMCP suchte eine erschwingliche Lösung, die die hohe Leistung und den hohen Durchsatz bietet, die für die Unterstützung umfassender Genomanalysen erforderlich ist.

„Die neuesten Genomsequenzierungstechniken erzeugen riesige Datenvolumen, für die enorme Computing- und Speicherkapazitäten erforderlich sind, um die Verarbeitung und Analyse im großen Umfang zu bewältigen.“ – Dr. Kumar Paritosh, Wissenschaftler am Centre for Genetic Manipulation of Crop Plants, University of Delhi, Süd-Campus

HPC auf dem neuesten Stand der Technik

Das CGMPC beauftragte Lenovo mit der Entwicklung und Bereitstellung einer HPC-Lösung, die die anspruchsvollen Leistungs- und Speicheranforderungen erfüllt.

Lenovo schlug das Genomics Optimization and Scalability Tool (GOAST) sowie eine HPC-Architektur vor, die speziell für die Genomanalyse optimiert wurde. Das vorkonfigurierte Hardware- und Software-Paket mit Lenovo ThinkSystem SR950-Servern mit skalierbaren Intel® Xeon® Prozessoren der 2. Generation ist äußerst schnell, kostengünstig und benutzerfreundlich.

Dr. Paritosh weiter: „Wir waren von den technischen Spezifikationen der vorgeschlagenen Lösung sehr beeindruckt. Bei ThinkSystem SR950 handelt es sich um eine Serverplattform mit acht Sockeln und die Arbeitsspeicherkapazität ist für die Genomanalyse ein sehr wichtiger Punkt. Wir sind von der Leistung des Systems für De-novo-Genomassemblierung mit Daten, die aus Sequenzierungsansätzen der dritten Generation gewonnen werden, schwer beeindruckt.“

Warum Lenovo? All-in-one-HPC für Genomik

In enger Zusammenarbeit mit Lenovo installierte das CGMPC zwei Lenovo ThinkSystem SR950-Server, die jeweils mit acht Intel® Xeon® Platinum 8260 CPUs ausgestattet wurden, sowie ein Network File System (NFS), das auf einem hybriden Datenspeicher-Array von Lenovo ThinkSystem DE2000H basiert.

Das GOAST-System umfasst das Betriebssystem CentOS, das Genome Analysis Toolkit (vier verschiedene Arten von Variantenaufruf-Workflows im GATK), die Software-Suite vom Broad Institute sowie andere Software-Abhängigkeiten, die für die GATK-Ausführung erforderlich sind.

Das Team von Lenovo konfigurierte und verbesserte das GOAST-System auf optimale Leistung und passte die Hardware so an, dass sie bei der Durchführung von Genomanalysen bei voller Kapazität laufen kann. Lenovo hat auch leicht auszuführende Skripte zu den komplexen und oft schwierig einzurichtenden GATK-Workflows entwickelt, um Einreichung, Überwachung und Management von Genomproben zu vereinfachen und dadurch benutzerfreundlicher für die Forscher zu machen.

„Das Team von Lenovo hat sich mit voller Energie eingesetzt, um ein HPC-System zu liefern, das die Anforderungen der Forscher sowohl in Bezug auf Leistung als auch Benutzerfreundlichkeit erfüllt.“ – Dr. Kumar Paritosh, Wissenschaftler am Centre for Genetic Manipulation of Crop Plants, University of Delhi, Süd-Campus

Ergebnisse

Mit dem Lenovo GOAST-System können Wissenschaftler am CGMCP auf leistungsstarke HPC-Ressourcen zugreifen, die extrem schnell, erschwinglich und benutzerfreundlich sind. Von entscheidender Bedeutung sind dabei ein hoher Durchsatz (mehr gleichzeitig analysierte Proben) und kurze Ausführungszeiten, wodurch die Zeit bis zur Erkenntnisgewinnung reduziert wird.

Ein wichtiger Forschungsbereich am CGMCP ist eine genetisch modifizierte Art von Senf, die im Vergleich zu bestehenden Varianten erhöhte Erträge erzielt. Um den Importbedarf Indiens an Speiseöl zu reduzieren, arbeiten Wissenschaftler am CGMCP daran, diese Senfart weiter zu verbessern, wobei mit der HPC-Lösung von Lenovo gewonnene Erkenntnisse genutzt werden. Dr. Kumar konnte z. B. bei der Identifizierung und Manipulation von Genen in Bezug auf Dürre- und Erkrankungsbeständigkeit zur Züchtung widerstandsfähigerer Nutzpflanzen auch Charakteristika von Brassica juncea zur Widerstandsfähigkeit gegenüber Albugo candida, einer Art von Rostpilz, die Pflanzen sehr schaden kann, zuordnen, kennzeichnen und integrieren.

Dr. Paritosh bestätigt: „Ich kann jetzt mehr Genome gleichzeitig verarbeiten und schneller Ergebnisse erzielen. Früher dauerte es 48 Stunden, um ein ~110X-Brassica juncea-Genom zu verarbeiten. Jetzt ist das dank der Leistungssteigerung für ultratiefe Genome 8 Mal schneller und dauert nur sechs Stunden.“1

 

  • Eine Leistungssteigerung für Human- und Pflanzengenomanalysen um das 36- bzw. 8-Fache1
  • 1,3 Stunden zur Verarbeitung eines ganzen 30X-Humangenoms; 6 Stunden zur Verarbeitung eines ganzen 110X-Brassica juncea-Genoms1
  • Kürzere Zeit bis zum Erkenntnisgewinn der Forscher

„Mit dem Lenovo GOAST-System kann ich mehr Daten analysieren und schneller neue Erkenntnisse gewinnen. Unsere neue HPC-Umgebung sorgt für Forschung auf dem neuesten Stand der Technik. Dadurch können wir Pflanzen züchten, die nahrhafter, dürre- und krankheitsbeständiger sind und höhere Erträge ergeben, um die Welt zu ernähren.“ – Dr. Kumar Paritosh, Wissenschaftler am Centre for Genetic Manipulation of Crop Plants, University of Delhi, Süd-Campus