Der Intel® Data Center Diagnostic Tool ist ein Tool zur Überprüfung des Zustands von CPU-Kernen.
Die aktuelle Version ist 630 und wurde am 12. Dezember 2024 veröffentlicht.
Ein Hauptaugenmerk von Hyperscale-Cloud-Anbietern und Unternehmensrechenzentren lag schon immer auf der Bereitstellung der bestmöglichen Betriebszeit und Zuverlässigkeit. In der Vergangenheit hat sich die Branche recht gut entwickelt und routinemäßig eine Betriebszeit von >99,999 % erreicht. Eine moderne Computerinfrastruktur bringt jedoch immer höhere Erwartungen der Benutzer an Quality of Service (QoS) und Hochverfügbarkeit mit sich. Diese Erwartungen unterstreichen den Bedarf an leistungsstarken Software-Tools, die helfen können, unerwartete Systemfehler zu identifizieren und zu minimieren, die die QoS oder die Betriebszeit beeinträchtigen könnten.
Bei Intel entwickeln und verwenden wir fortschrittliche Test- und Validierungstools auf Komponentenebene, die Fehler in unseren Produkten, die zu Systemfehlern führen können, erheblich reduzieren. Unsere Hyperscale-Kunden und deren Zulieferer verwenden dieselben von Intel entwickelten Software-Tools, um den Zustand der Flotte während der gesamten Lebensdauer ihrer Systeme zu erhalten. Sie haben erkannt, dass eine genaue Überwachung der Systemressourcen im Laufe der Zeit die Ausfallsicherheit der gesamten Flotte und die QoS der Kunden verbessern kann.
Intel ist sich bewusst, dass viele verschiedene Kunden von denselben Funktionen profitieren können, und die Intel® Data Center Diagnostic Tool ist eine optimierte Version dieser Software für die Verwaltung von On-Premise-Umgebungen.
Der Intel® Data Center Diagnostic Tool (Intel® DCDiag) wurde für IT-Manager entwickelt, die regelmäßige Wartungsarbeiten an ihren Rechenzentrumsflotten durchführen möchten. Intel® DCDiag kann in Rechenzentren jeder Größe eingesetzt werden, um ein Höchstmaß an fortlaufender Qualität und Verfügbarkeit zu gewährleisten. Darüber hinaus kann DCDiag für das periodische Flottenscreening im Vordergrund (~45 Minuten Laufzeit) oder im Hintergrundmodus verwendet werden und fehlerhafte Mikroprozessoren identifizieren. Eine regelmäßige Systemwartung hilft bei der proaktiven Identifizierung potenzieller Probleme und gibt Systemadministratoren die Möglichkeit, diese Mikroprozessoren zu ersetzen.
Intel® DCDiag ist eine Reihe von Tests, die den Großteil der SoC-Funktionalität methodisch überprüfen, einschließlich der Funktionalität jedes einzelnen Mikroprozessorkerns. Durch die Überprüfung, dass jede DCDiag-Berechnung korrekt ist, und nicht nur durch die Bestätigung, dass der Test ordnungsgemäß ausgeführt wurde, ist DCDiag in der Lage, viele Arten von Fehlern zu erkennen, einschließlich solcher, die sich als Silent Data-Fehler manifestieren.
Intel® DCDiag findet Fehler, indem es mit mehreren Tests die korrekten Ergebnisse des Prozessorbetriebs überprüft.
Zufällige Datensätze werden verwendet, um Anweisungen und Kerne zu testen. Die Meldung ist ein leicht verständliches Bestanden/Nicht-Bestehen auf einem Prozessor. Prozessoren, die den Test nicht bestehen, sollten zum Austausch an den Systemanbieter oder Distributor zurückgeschickt werden.
Die DCDiag-Testergebnisse sind so konzipiert, dass sie leicht verständlich sind. Wenn die Diagnose abgeschlossen ist, gibt das System eine der folgenden Meldungen zurück:
Überprüfen Sie das Prozessormodell und die Prozessorversion des Systems. Diese Meldung wird angezeigt, wenn der Intel Data Center Diagnostic Tool keine Produktionsversion der unterstützten Prozessoren erkennt. Entwicklungsmuster werden von diesem Tool nicht unterstützt.
Hier finden Sie Hilfe zur Identifizierung des Prozessors.
Die neueste Version des Microcodes behebt bekannte Probleme. Intel empfiehlt, auf die neueste Version zu aktualisieren.
Wenn die Testergebnisse einen Fehler anzeigen, überprüfen Sie , ob die Prozessoren Ihres Serverknotens noch unter Garantie stehen.
Wenn Sie einen Boxed Intel® Xeon®Prozessor haben, der noch unter einer 3-Jahres-Garantie steht, wenden Sie sich an Intel Customer Support, um Unterstützung zu erhalten.
Wenn Sie über einen Tray-Prozessor verfügen, wenden Sie sich an Ihren System- oder Prozessoranbieter oder Ihren Händler, um Unterstützung zu erhalten.
Die Intel® Data Center Diagnostic Tool ist eine Anwendung, die sowohl für Linux* als auch für Windows* verfügbar ist. Das Tool kann auf vielen aktuellen Linux*- und Windows*-Distributionen installiert und ausgeführt werden, siehe Installation unter Linux* und Windows*.
Ab Version 558 kann das Tool unter Windows* mit dem mitgelieferten MSI-Installationsprogramm installiert und auf jeder Version von Windows® 10, Windows* Server 2016 oder höher ausgeführt werden, die derzeit von Microsoft unterstützt wird. Konsultieren Sie die Windows* Server-Versionsinformationen, um festzustellen, welche Versionen von Windows* Serversystemen derzeit verfügbar sind und unterstützt werden.
Um eine optimale Abdeckung zu erzielen, führen Sie die Anwendung im Root-System eines Servers aus. Es ist möglich, es in einem Container oder einer virtuellen Maschine auszuführen, aber beachten Sie, dass einige Funktionen deaktiviert sein können.
Darüber hinaus hat Intel eine neue RAS-Funktion (Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit) namens Intel® In-Field-Scan eingeführt. Diese Tool-Familie wurde entwickelt, um Systemadministratoren dabei zu helfen, Prozessoren, die im Laufe der Zeit ausgefallen sind, schnell und einfach zu finden. Weitere Informationen zum Intel In-Field-Scan finden Sie unter diesem Link.
Intel® In-Field Scan und Intel® DCDiag sind komplementäre Testwerkzeuge. Intel® In-Field-Scan ist minimal intrusiv und darauf ausgelegt, schnell einen Kern zu testen, während alle anderen Kerne im Knoten weiterhin Kunden-Workloads ausführen. Intel® DCDiag ist eine umfassende Prozessortestsuite und ist am effektivsten, wenn der gesamte Verarbeitungsknoten für Tests reserviert ist. Da die Tools unterschiedliche Testinhalte ausführen, hat Intel festgestellt, dass jedes Tool unterschiedliche Fehler in den getesteten Prozessoren identifiziert.
Anmerkung: Für Entwickler: Intel hat das Open Data Center Diagnostic Project gestartet, das Intels Data Center Diagnostic Framework öffnet und ausgewählte Tests bereitstellt. Dies bietet Entwicklern einen konsistenten Testentwicklungsrahmen, der die Kreativität der Open-Source-Community einlädt, um das Cloud-Flottenmanagement durch die Entwicklung einzigartiger Testbildschirme und anderer innovativer Lösungen zu verbessern. Weitere Informationen finden Sie in diesem Framework und in den Tests.
Datum | Version | Beschreibung |
07. Juli 2021 | 540 | Erste Version |
16. August 2022 | 549 | Fehlerbehebung |
20. September 2022 | 549 | Befehl geändert, um das Tool zu aktivieren und die Aktivierung zu überprüfen |
10. Januar 2023 | 550 | Intel® Xeon® Prozessoren der 4. Generation einschließen |
20. Januar 2023 | 576 | Version 576 veröffentlicht |
14. Dezember 2023 | 594 | Version 594 veröffentlicht |
22. März 2024 | 603 | Version 603 Release |
Dienstag, 22. April 2024 | 605 | Version 605 veröffentlicht |
21. Juni 2024 | 612 | Version 612 veröffentlicht |
22. Juli 2024 | 613 | Hotfix-Version 613 |
Mittwoch, 20. September 2024 | 621 | Version 621 Release |
12. Dezember 2024 | 630 | Version 630 Release |