Was wird angezeigt?
Ein IERR ist ein schwerwiegender Fehler, der vom Prozessor gemeldet wird, aber im Allgemeinen von Geräten außerhalb des Prozessorkerns verursacht wird (z. B. Speicher, PCIe).
- Die Prozessorausführung ist in der Regel aufgrund eines Ereignisses außerhalb des Prozessors ins Stocken geraten.
- Dieses Problem wird häufig von einem CATERR-Ereignis begleitet, auf das für zusätzliche Informationen verwiesen werden kann.
Problembehebung:
Führen Sie die folgenden Schritte der Reihe nach durch:
- Überprüfen Sie das Systemereignisprotokoll (SEL) auf ECC-Ereignisse (Error Correction Code). Ein defekter Speicher kann eine IERR auslösen.
- Überprüfen Sie die SEL auf PCIe-Ereignisse. Fehlfunktionen von PCIe-Geräten können eine IERR auslösen.
- Stellen Sie sicher , dass die Treiber für das Betriebssystem (OS) für den Server und für alle kürzlich hinzugefügten Hardwaregeräte auf dem neuesten Stand sind. Veraltete BS-Treiber können eine IERR auslösen.
- Überprüfen Sie die Betriebssystemprotokolle auf MCA-Einträge (Machine Check Architecture), die auf einen Hardwarefehler hinweisen könnten, der die IERR ausgelöst haben könnte.
- Bestätigen Sie , dass Sie über das neueste BIOS für das Serversystem verfügen.
- Wechseln Sie zu Baseboard Management Controller Web Console > Konfiguration > Speicherkonfiguration > PPR-Typ, und legen Sie die PPR-Einstellungen auf "Schwer" fest.
- Wenn die Protokolle bestätigen, dass es ein bestimmtes Speichermodul gibt, das das Problem verursachen kann, setzen Sie den/die Speicher-Stick wieder ein und überwachen Sie den Server 24 Stunden lang.