Funktionsweise von Fault-elastischem Booten (FRB) auf Intel® Server-Mainboards und Intel®Serversysteme

Dokumentation

Produktinformationen und Dokumente

000007197

01.11.2017


Symptom (e):
  • Was ist FRB?
  • Wie kann ich wissen, ob es funktioniert?
  • Fehler resistentes Booten auf Intel® Servern.

Lösung:

Fehler resistentes Booten

Der BMC (Baseboard Management Controller) implementiert FRB Level 1, 2 und 3. Wenn der Standard-Bootstrap-Prozessor (BSP) den Startvorgang nicht abschließen kann, versucht FRB, mit einem alternativen Prozessor zu booten.

  • FRB Stufe 1 ist für die Wiederherstellung nach einem bist-Fehler vorgesehen, der während des Post-Fehlers erkannt wurde. Diese FRB Wiederherstellung wird vollständig durch BIOS-Code gehandhabt.
  • FRB Stufe 2 soll nach einem Watchdog-Timeout während der Post wiederhergestellt werden. Der Watchdog-Timer für FRB Level 2 ist im BMC implementiert.
  • FRB Stufe 3 soll nach einem Watchdog-Timeout bei Hard Reset oder Power-up wiederhergestellt werden. Dies bietet Hardwarefunktionen für diese frb.

FRB-1

In einem Multiprozessor-System registriert das BIOS die Anwendungsprozessoren in der Tabelle mit mehreren Prozessoren (MP) und den ACPI-APIC-Tabellen. Wenn ein Anwendungsprozessor (AP) die Initialisierung innerhalb einer bestimmten Zeit nicht durchführen kann, wird davon ausgegangen, dass er nicht funktionsfähig ist, wenn er von der BSP gestartet wird. Wenn das BIOS erkennt, dass ein Anwendungsprozessor fehlgeschlagen ist oder nicht funktionsfähig ist, fordert er den BMC auf, diesen Prozessor zu deaktivieren.

Der BMC generiert dann einen System-Reset, während er den Prozessor deaktiviert; im BIOS wird der ausgefallene Prozessor im nächsten Boot Zyklus nicht angezeigt. Der fehlerhafte AP wird weder in der MP-Tabelle noch in den ACPI-APIC-Tabellen aufgeführt und ist für das Betriebssystem unsichtbar. Wenn das BIOS erkennt, dass die BSP fehlgeschlagen ist, sendet es eine Anforderung an den BMC, um den aktuellen Prozessor zu deaktivieren. Wenn kein alternativer Prozessor verfügbar ist, piept der BMC den Lautsprecher und hält das System an. Wenn der BMC einen anderen Prozessor finden kann, wird der BSP-Besitz über einen System-Reset an diesen Prozessor übertragen.

FRB-2

Der zweite Watchdog-Timer (FRB-2) im BMC ist für ca. 6 Minuten im BIOS eingestellt und soll sicherstellen, dass das System den BIOS-POST-Vorgang beendet. Der FRB-2-Timer ist aktiviert, bevor der FRB-3-Timer deaktiviert wird, um ein UN geschützt es Zeitfenster zu verhindern. Nahe dem Ende von Pfosten, bevor die Option Roms initialisiert werden, sperrt das BIOS den FRB-2 Timer im BMC.

Wenn das System mehr als 1 GB Arbeitsspeicher enthält und der Benutzer jedes DWORD des Speichers testet, wird der Watchdog-Zeitgeber deaktiviert, bevor der Extended Memory-Test gestartet wird, da der Speichertest unter dieser Konfiguration mehr als 6 Minuten dauern kann. Wenn das System während der Bereitstellung hängt, deaktiviert das BIOS den Zeitgeber im BMC nicht, wodurch ein asynchrones System-Reset (ASR) generiert wird.

FRB-3

Der erste Timer (FRB-3) beginnt zu zählen, wenn das System kommt aus der Hard-Reset, die in der Regel etwa 5 Sekunden. Wenn die BSP erfolgreich zurückgesetzt und gestartet wird, wird das BIOS den FRB-3 Timer im BMC deaktivieren, indem er das FRB_TIMER_HLT-Signal (GPIO) debestätigt und das System mit dem Pfosten fort setzt. Wenn der Zeitgeber abläuft, weil der BSP den BIOS-Code nicht abrufen oder ausführen kann, setzt der BMC das System zurück und deaktiviert den ausgefallenen Prozessor.

Das System ändert weiterhin die BSP, bis der BIOS-Post die Deaktivierung des FRB-3-Timers im BMC überschreitet. Der BMC ertönt Signaltoncodes auf dem Lautsprecher, wenn er einen guten Prozessor nicht finden kann. Der Prozess des Radfahrens durch alle Prozessoren wird wiederholt, wenn der System-Reset oder der Energiezyklus.