Wie man sich von einem internen Fehler (IERR) für Intel® Server-Mainboards wiederherstellen kann

Dokumentation

Fehlerbehebung

000006043

17.07.2023

Was wird angezeigt?

Ein IERR ist ein schwerwiegender Fehler, der vom Prozessor gemeldet wird, aber im Allgemeinen von Geräten außerhalb des Prozessorkerns (z. B. Speicher, PCIe) verursacht wird.

  • Die Prozessorausführung ist in der Regel aufgrund eines Ereignisses außerhalb des Prozessors zum Stillstand gekommen.
  • Dieses Problem wird oft von einer CATERR-Veranstaltung begleitet, auf die für zusätzliche Informationen verwiesen werden kann.

Behebung des Problems:

Führen Sie die folgenden Schritte aus, um:

  1. Sehen Sie sich das System Event Log (SEL) für ECC-Ereignisse (Error Correction Code) an. Defekter Speicher kann eine IERR auslösen.
  2. Sehen Sie sich das SEL für beliebige PCIe-Events an. Wenn pcIe-Geräte ausfallen, kann das eine IERR auslösen.
  3. Stellen Sie sicher , dass die Betriebssystemtreiber für den Server und alle kürzlich hinzugefügten Hardwaregeräte auf dem neuesten Stand sind. Veraltete BS-Treiber können eine IERR auslösen.
  4. Überprüfen Sie die BS-Protokolle auf ALLE MCA-Einträge (Machine Check Architecture), die auf einen Hardwarefehler hindeuten, der die IERR auslösen könnte.
  5. Stellen Sie sicher , dass Sie über das neueste BIOS für das Serversystem verfügen.
  6. Gehen Sie zur Webkonsole für den Baseboard Management Controller > Configuration > Memory Configuration > PPR Type und setzen Sie die PPR-Einstellungen auf "Hard".
  7. Wenn die Protokolle bestätigen, dass es ein bestimmtes Speichermodul(en) gibt, das das Problem verursachen kann, setzen Sie die Speichersticks erneut ein und überwachen den Server 24 Stunden lang.

Verwandte Themen
Mein Server stürzt ab und zeigt diesen Fehler an: Processor CPU Machine Chk
Für Firmware-Updates und Tipps zur Fehlerbehebung
Fehlerbehebungshandbücher für das Systemereignisprotokoll für Intel® Server-Mainboards