Schritte zur Isolierung von DIMM-Fehlern im Vergleich zu DIMM-Steckplatzfehlern auf Intel® Server Board Produktreihen
Der korrigierte ECC-Fehlerschwellenwert erreichte Fehler bei mehreren DIMMs wurde in mehreren Servern basierend auf Intel® Server Board S2600WF gemeldet.
DER ECC-Fehler bleibt auch nach mehreren DIMM-Ersätzen weiterhin bestehen.
Wenn ein ECC-Fehler auch nach dem Austausch mehrerer DIMM-Speicher weiterhin auftritt, ist ein vollständiger Test erforderlich, um den DIMM-Fehler im Vergleich zum Mainboard-DIMM-Steckplatzfehler zu isolieren.
Ordnen Sie den Speicher neu an, um zu sehen, ob das gekennzeichnete DIMM noch ECCs an anderen Steckplätzen darstellt. Dies deutet auf ein beschädigtes oder leicht beschädigtes DIMM hin.
Wenn auf dem gleichen DIMM-Steckplatz, aber mit einem anderen DIMM auf dem DIMM-Steckplatz ein ECC-Fehler gemeldet wird, überprüfen Sie, ob sich Ablagerungen/Staub im Sockel befinden, die eine Fehlerverbindung verursachen können. Wenn kein Ablagerungen/Staub vorhanden ist, kann es sich um einen Mainboard-DIMM-Steckplatzfehler handeln, und die S2600WF-Platine muss ersetzt werden.
Wenn es ein DIMM des Systems mit einem leichten oder potenziellen Fehler gibt, wird es durch die unten stehenden Schritte erkannt. Dieser Vorgang kann langsam sein, kann aber ein potenzielles Problem mit einer bestimmten DIMM-Komponente identifizieren.
Testschritte:
- Entfernen Sie alle DIMMs.
- Folgen Sie dem Abschnitt "DIMM-Richtlinien für die Bevölkerung" im Abschnitt "Technische Produktspezifikationen für Intel® Serverprodukte " und installieren Sie nur 1-pc-DIMM , bei dem in der Vergangenheit kein ECC-Fehler aufgetreten war.
- Starten Sie das System mit 1pcs DIMMs und führen Sie es einige Zeit lang aus. Überprüfen Sie , ob ein ECC-Fehler vorliegt.
- Befolgen Sie die gleichen Richtlinien und installieren Sie das 2. DIMM , das in der Vergangenheit keinen ECC-Fehler angezeigt hat.
- Starten Sie das System mit 2-pc-DIMMs und führen Sie es einige Zeit lang aus. Überprüfen Sie , ob ein ECC-Fehler vorliegt.
- Befolgen Sie die gleichen Richtlinien und installieren Sie das 3. DIMM , das in der Vergangenheit keinen ECC-Fehler angezeigt hat.
- Starten Sie das System mit 3pcs DIMMs und führen Sie es einige Zeit lang aus. Überprüfen Sie , ob ein ECC-Fehler vorliegt.
- Befolgen Sie die gleichen Richtlinien und installieren Sie das 4. DIMM , das in der Vergangenheit keinen ECC-Fehler angezeigt hat.
- Starten Sie das System mit installierten 4pcs DIMMs und überprüfen Sie, ob ein ECC-Fehler vorliegt.
- Führen Sie die gleichen Schritte durch, um jedes Mal ein weiteres DIMM zu installieren und das System zu starten. Überprüfen Sie, ob ein ECC-Fehler vorliegt.
- Führen Sie den Test durch, bis alle guten DIMMs belegt sind.
- Führen Sie die gleichen Schritte durch, um das DIMM zu installieren, das einen ECC-Fehler meldet, und starten Sie das System. Überprüfen Sie, ob ein ECC-Fehler vorliegt.
Jetzt sollten alle ursprünglichen DIMM-Steckplätze belegt und getestet werden. Sogar der ursprüngliche DIMM-Steckplatz mit dem ECC-Fehler wurde belegt und getestet.