Intel® Data Center Diagnostic Tool für Intel® Xeon® Prozessoren

Dokumentation

Wartung und Leistung

000058107

14.03.2022

Einführung

Der Intel® Data Center Diagnostic Tool ist ein Diagnosesoftware-Tool, das auf Ihren Rechenzentrumsplattformen ausgeführt werden kann, um:

  • Überprüfen Sie die Funktionalität aller Kerne in einem Intel® Xeon® Prozessor.
  • Im Rahmen eines regulären Systemwartungsprogramms verwendet werden.

Hohe Zuverlässigkeit und Verfügbarkeit im Rechenzentrum erfordern die richtigen Tools und eine Verpflichtung zur Wartung. Intel ist der Meinung, dass es eine branchenweit beste Praxis ist, Wartungstools wie diese sowohl für die anfängliche Bereitstellung als auch für regelmäßige Tests zu verwenden, um die beste Systemerfahrung zu gewährleisten.

    Hinweis
    • Die moderne Computerinfrastruktur bringt eine stetig steigende Nachfrage nach Verarbeitungsleistung in Kombination mit den geschäftlichen Erwartungen an die Servicequalität und hohe Verfügbarkeit (und Garantien in Service-Level-Vereinbarungen [SLAs] im Allgemeinen). Diese Erwartungen legen Wert auf die Notwendigkeit leistungsstarker Software-Tools, die helfen können, unerwartete Systemfehler vorherzusagen, zu identifizieren und zu minimieren, die die Servicequalität oder Betriebszeit beeinträchtigen könnten. Lesen Sie einen Artikel von IDC , der den Bedarf an Diagnosetools einschließlich der Intel® Data Center Diagnostic Tool abdeckt.

    Systemvoraussetzungen

    Der Intel Data Center Diagnostic Tool ist eine Linux* Anwendung, die auf vielen aktuellen Linux-Distributionen installiert und ausgeführt werden kann. Es gibt keine Windows* Version dieses Tools.

    Führen Sie die Anwendung für optimale Abdeckung im Stammsystem eines Servers aus. Es ist möglich, es in einem Container oder einer virtuellen Maschine auszuführen, aber beachten Sie, dass einige Funktionen möglicherweise deaktiviert werden.

    Unterstützte Prozessoren:

    • Skalierbare Intel® Xeon® Prozessoren der 3. Generation (ehemals Ice Lake und Cooper Lake)
    • Skalierbare Intel® Xeon® Prozessoren der 2. Generation (ehemals Cascade Lake)
    • Skalierbare Intel® Xeon® Prozessoren der 1. Generation (vormals Skylake)
    • Intel® Xeon® E5 v4 Prozessoren (vormals Broadwell)
    • Intel® Xeon® E7-v4-Prozessoren (vormals Broadwell)
    Hinweis
    • Für Entwickler: Intel hat das Open Data Center Diagnostic Project gestartet, das Intels Data Center Diagnostic Framework öffnet und ausgewählte Tests anbietet. Dies bietet Entwicklern ein konsistentes Testentwicklungs-Framework, das die Kreativität der Open-Source-Community einlädt, das Cloud-Flottenmanagement durch die Entwicklung einzigartiger Testbildschirme und anderer innovativer Lösungen zu verbessern. Weitere Informationen und Zugriff auf dieses Framework und Tests

    Installation

    Notizen
    • Weitere Einzelheiten finden Sie in der Datei /usr/share/doc/dcdiag/README.rst , die in der Installation enthalten ist.
    • Wir empfehlen, die Schritte in den unten stehenden Abschnitten zu verwenden, um mit dem Repository zu verlinken, wodurch sichergestellt wird, dass Sie die neueste Version der Intel® Data Center Diagnostic Tool erhalten. Wenn Sie jedoch eine herunterladbare Binärdatei benötigen, verwenden Sie eine RPM-Datei oder DEB-Datei.

     

    Debian*/Ubuntu*

    Um die Intel® Data Center Diagnostic Tool Softwarepakete auf Debian*-basierten Distributionen zu installieren, fügen Sie das Intel software Paket-Repository hinzu und installieren Sie die entsprechenden Pakete.

    Bevor Sie die Konsole kopieren+einfügen, möchten Sie möglicherweise s ascii ls ausführen und Ihr Passwort eingeben, um zu verhindern, dass die Befehle von der s ascii Passworteingabeaufforderung verwendet werden:

    Einrichtung des Schlüssels zur Verifizierung der Paketsignaturen

    curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

    Repository einrichten

    sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main'

    Installieren Sie das Paket

    sudo apt-get update
    sudo apt-get install dcdiag

    Fedora*/CentOS*/RHEL*

    Um die Intel Data Center Diagnostic Tool Softwarepakete auf einer Fedora-basierten Distribution zu installieren, fügen Sie das Intel software Paket-Repository hinzu und installieren Sie das Paket.

    Beim ersten Installieren werden Sie von YUM oder DNF aufgefordert, den Signaturschlüssel zu akzeptieren. Stellen Sie sicher, dass der Fingerabdruck wie folgt ist, und akzeptieren Sie ihn dann:
    Userid: "CN=Release Key"
    Fingerprint: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

    Bevor Sie die Konsole kopieren+einfügen, möchten Sie möglicherweise s ascii ls ausführen und Ihr Passwort eingeben, um zu verhindern, dass die Befehle von der s ascii Passworteingabeaufforderung verwendet werden:

    Installation der Repository-Datei

    sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

    Installieren Sie das Paket

    sudo yum install dcdiag

    OpenSUSE*/SUSE Linux Enterprise*:

    Installation der Repository-Datei

    sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

    Installieren Sie das Paket

    sudo zypper install dcdiag

    Sie werden benachrichtigt, dass respond.xml nicht unterzeichnet ist. Antworten Sie mit Ja, um fortzufahren. Sie erhalten eine weitere Gelegenheit, die Paketsignatur zu überprüfen. Stellen Sie sicher, dass der Fingerabdruck wie folgt ist, und akzeptieren Sie ihn dann:

    Repository: dcdiag
    Key Name: CN=Release Key
    Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
    Key Created: Tue 24 Nov 2020 01:47:38 PM PST
    Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
    Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

     

    So testen Sie den Intel Xeon Prozessor

    Nach der Installation wird die Intel Data Center Diagnostic Tool automatisch für die Hintergrundausführung aktiviert. Sie können mit dem folgenden Befehl überprüfen, ob dies erfolgreich ist:

    # systemctl status dcdiag
    ● dcdiag.service - Intel® Data Center Diagnostic Tool
    Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
    Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
    Docs: file:///usr/share/doc/dcdiag/README.rst
    Main PID: 8777 (dcdiag)
    CGroup: /system.slice/dcdiag.service
    └─8777 /usr/bin/dcdiag --service

    Hinweis

    Wenn Sie die Hintergrundausführung des Intel Data Center Diagnostic Tool deaktivieren möchten, führen Sie Folgendes aus:

    systemctl disable --now dcdiag

    Weitere Informationen zum Einsatz des Befehls systemctl(1) finden Sie auf der Linux* Manuellen Seite.

    Wenn beim Ausführen der Intel Data Center Diagnostic Tool im Hintergrund Fehler erkannt werden, wird das Tool sie im Systemprotokoll protokollieren. Das Tool kann auch abfragen, ob im Hintergrundscan Fehler mit dem Argument --query erkannt wurden.

    # dcdiag --query
    Intel® Data Center Diagnostic Tool Version 506
    Test completed successfully. No issues detected.

    Dieses Tool kann auch manuell im Vordergrund ausgeführt werden, indem es an einer Linux Eingabeaufforderung ausgeführt wird:

    # dcdiag

    Der manuelle Test läuft ca. 45 Minuten und hat eine hohe CPU-Auslastung.

    Nach Abschluss der Diagnose gibt das System eine der folgenden Meldungen zurück:

    • Der Test wurde erfolgreich abgeschlossen. Es wurden keine Probleme erkannt.
       
    • Der Test wurde erfolgreich abgeschlossen. Ein oder mehrere Fehler bei der Computerüberprüfung sind aufgetreten. Überprüfen Sie bitte die Systemprotokolle.
       
    • Dieser Prozessor wird von dieser Version des Tools nicht unterstützt.

      Überprüfen Sie das Prozessormodell und die Version des Systems. Diese Meldung wird angezeigt, wenn der Intel Data Center Diagnostic Tool keine Produktionsversion der unterstützten Prozessoren erkennt. Entwicklungsmuster werden von diesem Tool nicht unterstützt.

      Hier finden Sie Hilfe bei der Identifizierung des Prozessors.
       
    • Test abgeschlossen. Die Ergebnisse sind aufgrund einer veralteten Version von Microcode schlüssig.

      Die neueste Version des Microcode behebt bekannte Probleme. Bitte aktualisieren. Microcode-Updates werden in der Regel von Ihrem Linux Distribution-Anbieter bereitgestellt, sowie Sicherheitsupdates und andere Firmware-Updates für verschiedene Komponenten. Wenn diese Updates auf Ihrem System nicht aktiviert sind, empfehlen wir, dass Sie diese Updates aktivieren. Der Microcode wird bei jedem Boot automatisch vom Linux Kernel geladen und kann zur Laufzeit mit dem folgenden Befehl als Root geladen werden:

      echo 1 > /sys/devices/system/cpu/microcode
       
    • Test abgeschlossen. Die Ergebnisse sind nicht schlüssig, da das System die Temperaturgrenzen überschreitet

      Dies kann auf eine Vielzahl von Problemen mit dem System zurückzuführen sein, die nicht genügend Kühlung bieten, damit die CPU innerhalb der erforderlichen Temperaturgrenzwerte arbeiten kann. Wir empfehlen Ihnen, Ihr System zu überprüfen, um sicherzustellen, dass die erforderliche Kühlung korrekt funktioniert. Dies kann fehlerhafte Lüfter, falschen Luftstrom oder ein anderes Umgebungsproblem umfassen.
       
    • Test abgeschlossen. Die Ergebnisse sind nicht schlüssig. Es ist ein oder mehrere Fehler bei der Computerüberprüfung aufgetreten.

      Überprüfen Sie die Systemprotokolle.
       
    • Test fehlgeschlagen. Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.

      Falls die Testergebnisse ausfallen, überprüfen Sie, ob die Prozessoren Ihres Serverknotens noch durch eine Garantie abgedeckt sind:

      • Wenn Sie einen Boxed Intel® Xeon® Prozessor haben, der noch unter einer 3-jährigen Garantie steht, wenden Sie sich an den Intel Kundensupport, um Unterstützung zu erhalten.
      • Falls Sie einen Tray-Prozessor haben, wenden Sie sich an Ihren System- oder Prozessoranbieter oder Kaufort, um zu überprüfen, ob der Prozessor noch durch eine Garantie abgedeckt ist.
        HinweisTray-Prozessoren werden direkt an Systemhersteller oder von Intel autorisierte Distributoren verkauft. Intel bietet keine direkte Garantie für Endbenutzer für Tray-Prozessoren, es sei denn, sie wurden in Intel® Data-Center-Blocks (Intel® DCB) Serversystemen vorinstalliert. Mit Ausnahme von Intel DCB Systemen übernimmt der Anbieter oder Kaufort des Prozessors oder des Systems die Garantie für den Tray-Prozessor, wenn der Prozessor vorinstalliert war. Intel empfiehlt den Kauf von autorisierten Intel Distributoren, anerkannten Intel Lieferanten und Fachhändlern von Intel® Produkten.
      • Beachten Sie, dass Intel kein Ersatzprogramm nach Ablauf der Garantie hat.
         
    • Test fehlgeschlagen.

      Der Test wurde abgeschlossen, und auf dem physischen Prozessor, der /sys/devices/system/cpu/cpuXX enthält, wurde ein Fehler erkannt.

      Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.

    • Test fehlgeschlagen.

      Der Test kann nicht feststellen, welcher physische Prozessor den Fehler verursacht hat.

      Wenden Sie sich an Ihren Systemhersteller oder Prozessoranbieter, um Support zu erhalten.
       

    Versionsgeschichte

    DatumVersionBeschreibung
    7. Juli 2021540Erste Version

     

    Verwandte Themen
    Zentrale Website Intel® Xeon® Support
    Garantieleitfaden für Intel® Prozessoren