Intel® Data Center Diagnostic Tool für Intel® Xeon® Prozessoren

Dokumentation

Wartung und Leistung

000058107

13.03.2023

Einführung

Der Intel® Data Center Diagnostic Tool ist ein Diagnosesoftware-Tool, das auf Ihren Rechenzentrumsplattformen ausgeführt werden kann, um:

  • Überprüfen Sie die Funktionalität aller Kerne in einem Intel® Xeon® Prozessor.
  • Im Rahmen eines regulären Systemwartungsprogramms verwendet werden.

Hohe Zuverlässigkeit und Verfügbarkeit im Rechenzentrum erfordern die richtigen Tools und eine Verpflichtung zur Wartung. Intel ist der Meinung, dass es eine branchenweit beste Praxis ist, Wartungstools wie diese sowohl für die anfängliche Bereitstellung als auch für regelmäßige Tests zu verwenden, um die beste Systemerfahrung zu gewährleisten.

HinweisDie moderne Computerinfrastruktur bringt eine stetig steigende Nachfrage nach Verarbeitungsleistung in Kombination mit den geschäftlichen Erwartungen an die Servicequalität und hohe Verfügbarkeit (und Garantien für Service-Level-Vereinbarungen [SLAs] im Allgemeinen). Diese Erwartungen betonten den Bedarf an leistungsstarken Software-Tools, die helfen können, unerwartete Systemfehler vorherzusagen, zu identifizieren und zu minimieren, die die Servicequalität oder Betriebszeit beeinträchtigen könnten. Lesen Sie einen Artikel von IDC , der den Bedarf an Diagnosetools einschließlich der Intel® Data Center Diagnostic Tool abdeckt.

Systemvoraussetzungen

Der Intel Data Center Diagnostic Tool ist eine Anwendung, die sowohl für Linux* als auch für Windows* Betriebssysteme verfügbar ist. Das Tool kann auf vielen aktuellen Linux* und Windows* Distributionen installiert und ausgeführt werden, siehe Installation.

Ab Version 558 kann das Tool unter Windows* mit dem bereitgestellten MSI-Installationsprogramm installiert und auf einer beliebigen Version von Windows* ausgeführt werden, die derzeit von Microsoft unterstützt wird. Ziehen Sie die Versionsinformationen von Windows* Server zurate, um festzustellen, welche Versionen von Windows* Serversystemen derzeit verfügbar und unterstützt sind.

Führen Sie die Anwendung für optimale Abdeckung im Stammsystem eines Servers aus. Es ist möglich, sie in einem Container oder einer virtuellen Maschine auszuführen, aber beachten Sie, dass einige Funktionen möglicherweise deaktiviert werden.

Unterstützte Prozessoren:

  • Skalierbare Intel® Xeon® Prozessoren der 4. Generation (ehemals Sapphire Rapids)
  • Skalierbare Intel® Xeon® Prozessoren der 3. Generation (ehemals Ice Lake und Cooper Lake)
  • Skalierbare Intel® Xeon® Prozessoren der 2. Generation (ehemals Cascade Lake)
  • Skalierbare Intel® Xeon® Prozessoren der 1. Generation (vormals Skylake)
  • Intel® Xeon® E5 v4 Prozessoren (vormals Broadwell)
  • Intel® Xeon® E7-v4-Prozessoren (vormals Broadwell)
HinweisFür Entwickler: Intel hat das Open Data Center Diagnostic Project gestartet, das Intels Data Center Diagnostic Framework öffnet und ausgewählte Tests anbietet. Dies bietet Entwicklern ein konsistentes Testentwicklungs-Framework, das die Kreativität der Open-Source-Community einlädt, das Cloud-Flottenmanagement durch die Entwicklung einzigartiger Testbildschirme und anderer innovativer Lösungen zu verbessern. Weitere Informationen und Zugriff auf dieses Framework und Tests

Installation

Hinweis

Weitere Einzelheiten finden Sie im /usr/share/doc/dcdiag/README.rst (Linux*) or C:\Program Files\Intel\Data Center Diagnostic Tool\README.rst (Windows*) file included in the installation.

Wir empfehlen, die Schritte in den unten stehenden Abschnitten zu verwenden, um mit dem Repository zu verlinken, wodurch sichergestellt wird, dass Sie die neueste Version der Intel® Data Center Diagnostic Tool erhalten. Wenn Sie jedoch eine herunterladbare Binärdatei benötigen, verwenden Sie eine RPM-Datei oder DEB-Datei oder ein Windows* MSI-Installationsprogramm.

 

Debian*/Ubuntu*

Um die Intel® Data Center Diagnostic Tool Softwarepakete auf Debian*-basierten Distributionen zu installieren, fügen Sie das Intel software Paket-Repository hinzu und installieren Sie die entsprechenden Pakete.

Bevor Sie die Konsole kopieren+einfügen, möchten Sie möglicherweisesudo ls and enter your password to prevent the commands from being consumed by the sudo password prompt:

Einrichtung des Schlüssels zur Verifizierung der Paketsignaturen

curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

Repository einrichten

sudo apt-add-repository 'deb [arch=amd64] https://repositories.intel.com/dcdt/debian stable main'

Installieren Sie das Paket

sudo apt-get update
sudo apt-get install dcdiag

Fedora*/CentOS*/RHEL*

Um die Intel Data Center Diagnostic Tool Softwarepakete auf einer Fedora-basierten Distribution zu installieren, fügen Sie das Intel software Paket-Repository hinzu und installieren Sie das Paket.

Beim ersten Installieren werden Sie von YUM oder DNF aufgefordert, den Signaturschlüssel zu akzeptieren. Stellen Sie sicher , dass der Fingerabdruck wie folgt ist, und akzeptieren Sie ihn dann:
Benutzerid: CN=Release-Schlüssel
Fingerabdruck: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

Bevor Sie die Konsole kopieren+einfügen, möchten Sie möglicherweisesudo ls and enter your password to prevent the commands from being consumed by the sudo password prompt:

Installation der Repository-Datei

sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

Installieren Sie das Paket

sudo yum install dcdiag

OpenSUSE*/SUSE Linux Enterprise*:

Installation der Repository-Datei

sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

Installieren Sie das Paket

sudo zypper install dcdiag

Sie werden darauf hingewiesen, dass respond.xml is not signed. Respond yes to continue. You will be given another chance to verify the package signature. Verify that the fingerprint is as follows, and then accept it:

Repository: dcdiag
Key Name: CN=Release Key
Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
Key Created: Tue 24 Nov 2020 01:47:38 PM PST
Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

Microsoft Windows*

MSI-Installationsprogramm herunterladen

Laden Sie die Intel® Data Center Diagnostic Tool Installationsdatei an den ausgewählten Speicherort herunter und führen Sie sie aus.

Intel® Data Center Diagnostic Tool für Intel® Xeon® Prozessoren für Windows*

Installieren Sie das Paket

Wenn Sie eine grafische Benutzeroberfläche oder Befehlszeile verwenden, für die dem Installationsprogramm keine zusätzlichen Optionen zur Verfügung gestellt werden, wird eine Eingabeaufforderung zur Benutzerkontensteuerung angezeigt, die eine Autorisierung fordert. Stellen Sie sicher, dass das Installationsprogramm von Intel Corporation unterzeichnet ist, und autorisieren Sie Änderungen am Gerät. Sobald das Installationsprogramm autorisiert ist, wird das Tool am Standardspeicherort installiert und das Installationsprogramm wird beendet.

Leise Installation

/quiet command line switch can be used to perform quiet installation. This type of installation does not require any user interaction, which makes it especially useful for remote installation.

Beachten Sie, dass die unbeaufsichtigte Installation die Aufforderung zur Benutzerzugriffskontrolle nicht aktiviert. Daher muss das Installationsprogramm von der Administratorkonsole aus ausgeführt werden.

Verwenden Sie die /help or /? command line switch to display all available command line options for the installer.

Die Intel Data Center Diagnostic Tool ist an einem Standardspeicherort installiert:

C:\Program Files\Intel\Data Center Diagnostic Tool\

 

So testen Sie den Intel® Xeon® Prozessor

Auf Linux* Systemen können Intel® Data Center Diagnostic Tool vom Systemadministrator für die Hintergrundausführung aktiviert werden.

Sie können Intel® Data Center Diagnostic Tool mit dem folgenden Befehl aktivieren und starten :

# systemctl enable --now dcdiag

Sie können mit dem folgenden Befehl überprüfen, ob dies erfolgreich ist:

# systemctl status dcdiag

Beispielreaktion auf den Befehl:

● dcdiag.service - Intel® Data Center Diagnostic Tool

Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)

Active: active (running) since Fri 2021-02-19 11:24:17 MST;

Docs: file:///usr/share/doc/dcdiag/README.rst

Main PID: 8777 (dcdiag)

CGroup: /system.slice/dcdiag.service

└─8777 /usr/bin/dcdiag –service

Wenn bei der Ausführung der Intel® Data Center Diagnostic Tool im Hintergrund Fehler erkannt werden, wird das Tool sie im Systemprotokoll protokollieren. Das Tool kann auch abfragen, ob im Hintergrundscan Fehler erkannt wurden, mithilfe der --query argument.

# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.

Der Hintergrundausführungsmodus wird derzeit für die Windows* Version des Tools nicht unterstützt.

Dieses Tool kann auch manuell im Vordergrund ausgeführt werden, indem Es in einer Linux* oder Windows* Eingabeaufforderung ausgeführt wird:

# dcdiag

>"C:\Program Files\Intel\Data Center Diagnostic Tool\dcdiag.exe"

Beachten Sie, dass in Windows* Intel® Data Center Diagnostic Tool Installationsprogramm die PATH-Variable des Systems nicht automatisch aktualisiert. Daher ist ein vollständiger absoluter oder relativer Pfad zum Starten des Tools erforderlich.

Der manuelle Test läuft ca. 45 Minuten und hat eine hohe CPU-Auslastung.

Nach Abschluss der Diagnose gibt das System eine der folgenden Meldungen zurück:

  • Der Test wurde erfolgreich abgeschlossen. Es wurden keine Probleme erkannt.
  • Der Test wurde erfolgreich abgeschlossen. Ein oder mehrere Fehler bei der Computerüberprüfung sind aufgetreten. Überprüfen Sie bitte die Systemprotokolle.
  • Dieser Prozessor wird von dieser Version des Tools nicht unterstützt.

    Überprüfen Sie das Prozessormodell und die Version des Systems. Diese Meldung wird angezeigt, wenn der Intel Data Center Diagnostic Tool keine Produktionsversion der unterstützten Prozessoren erkennt. Entwicklungsmuster werden von diesem Tool nicht unterstützt.

    Hier finden Sie Hilfe bei der Identifizierung des Prozessors.
  • Test abgeschlossen. Die Ergebnisse sind aufgrund einer veralteten Version von Microcode schlüssig.

    Die neueste Version des Microcode behebt bekannte Probleme. Bitte aktualisieren. Microcode-Updates werden in der Regel von Ihrem Linux* Distributionsanbieter bereitgestellt, sowie Sicherheitsupdates und andere Firmware-Updates für verschiedene Komponenten. Wenn diese Updates auf Ihrem System nicht aktiviert sind, empfehlen wir, dass Sie diese Updates aktivieren. Der Microcode wird bei jedem Boot automatisch vom Linux* Kernel geladen und kann zur Laufzeit mit dem folgenden Befehl als Root geladen werden:

    echo 1 > /sys/devices/system/cpu/microcode

 

Unter Windows* werden Microcode-Updates über standardmäßige Windows* Update-Kanäle bereitgestellt. Wenn diese Updates auf Ihrem System nicht aktiviert sind, empfehlen wir, dass Sie diese Updates aktivieren.

  • Test abgeschlossen. Die Ergebnisse sind nicht schlüssig, da das System die Temperaturgrenzen überschreitet

    Dies kann auf eine Vielzahl von Problemen mit dem System zurückzuführen sein, die nicht genügend Kühlung bieten, damit die CPU innerhalb der erforderlichen Temperaturgrenzwerte arbeiten kann. Wir empfehlen Ihnen, Ihr System zu überprüfen, um sicherzustellen, dass die erforderliche Kühlung korrekt funktioniert. Dies kann fehlerhafte Lüfter, falschen Luftstrom oder ein anderes Umgebungsproblem umfassen.
     
  • Test abgeschlossen. Die Ergebnisse sind nicht schlüssig. Es ist ein oder mehrere Fehler bei der Computerüberprüfung aufgetreten.

    Überprüfen Sie die Systemprotokolle.
     
  • Test fehlgeschlagen. Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.
     
  • Falls die Testergebnisse ausfallen, prüfen wenn die Prozessoren Ihres Serverknotens noch durch eine Garantie abgedeckt sind:
    • Wenn Sie einen Boxed Intel® Xeon® Prozessor haben, der noch unter einer 3-jährigen Garantie steht, wenden Sie sich an den Intel Kundensupport, um Unterstützung zu erhalten.
    • Falls Sie einen Tray-Prozessor haben, wenden Sie sich an Ihren System- oder Prozessoranbieter oder Kaufort, um zu überprüfen, ob der Prozessor noch durch eine Garantie abgedeckt ist.
HinweisTray-Prozessoren werden direkt an Systemhersteller oder von Intel autorisierte Distributoren verkauft. Intel bietet keine direkte Garantie für Endbenutzer für Tray-Prozessoren, es sei denn, sie wurden in Intel® Data-Center-Blocks (Intel® DCB) Serversystemen vorinstalliert. Mit Ausnahme von Intel DCB Systemen übernimmt der Anbieter oder Kaufort des Prozessors oder des Systems die Garantie für den Tray-Prozessor, wenn der Prozessor vorinstalliert war. Intel empfiehlt den Kauf von autorisierten Intel Distributoren, anerkannten Intel Lieferanten und Fachhändlern von Intel® Produkten.
  • Beachten Sie, dass Intel kein Ersatzprogramm nach Ablauf der Garantie hat.
  • Test fehlgeschlagen.
  • Der Test wurde abgeschlossen, und auf dem physischen Prozessor, der /sys/devices/system/cpu/cpuXX.
  • Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.
  • Test fehlgeschlagen.
  • Der Test kann nicht feststellen, welcher physische Prozessor den Fehler verursacht hat.
  • Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.

*Andere Namen und Marken sind Eigentum der anderen.

Versionsgeschichte

DatumVersionBeschreibung
7. Juli 2021540Erste Version
16. August 2022549Fehlerbehebung
20. September 2022549Der Befehl wurde geändert, um das Tool zu aktivieren und die Aktivierung zu überprüfen
10. Januar 2023550Enthalten Prozessoren der Intel® Xeon® der 4. Generation

 

Verwandte Themen
Zentrale Website Intel® Xeon® Support
Garantieleitfaden für Intel® Prozessoren
Intel® Data Center Diagnostic Tool für Intel® Xeon® Prozessoren für Windows*