Artikel-ID: 000056596 Inhaltstyp: Produktinformationen und Dokumente Letzte Überprüfung: 26.07.2021

Häufige SMART-Attribute für Intel® SSD- und Intel® Optane™-Technologie-Produkte von Clients

Zusammenfassung

Erklärt, wie SMART-Attribute den Integrität eines Speichergeräts überwachen können. Dieser Artikel beschreibt allgemeine Attribute, die auf Intel® SSD-Clients unterstützt werden

Beschreibung

Was sind SMART-Attribute und wie können sie nützlich sein?

Auflösung

Die Self-Monitoring, Analysis and Reporting Technology (SMART) ist ein offener Standard, der von Laufwerken und Hosts verwendet wird, um den Zustand der Laufwerke zu überwachen und potenzielle Probleme zu melden.

Jedes Laufwerk wird unter einem vordefinierten Satz von SMART-Attributen und entsprechenden Schwellenwerten betrieben, von denen das Laufwerk während des normalen Betriebs nicht übergeben sollte.

Die Beschreibungen einiger SMART Health Info-Attribute werden in der folgenden Tabelle angezeigt. Diese Attribute hängen von der ausgewählten Intel SSD oder einem anderen Laufwerk ab. Ihr SSD oder Laufwerk unterstützt einige dieser Attribute möglicherweise nicht.

SMART-Attribute für SATA

Id

Attribut und Beschreibung (SATA)

05

Neu zugewiesene Sektoranzahl

Der Rohwert zeigt die Anzahl der aus dem Werk aus dem Werk austretenden Blöcken an (anzahl der gewachsenen Defekten).

09

Anzahl der Ein-/Aus-Stunden

Der Rohwert gibt die kumulierte Anzahl von Ein-/Aus-Stunden über die Lebensdauer des Geräts an.

Hinweis:  Der Ein/Aus-Status der Device Initiated Power Management (DIPM)-Funktion beeinflusst die gemeldeten Stunden.

  • Wenn DIPM eingeschaltet ist, umfasst der aufgezeichnete Wert nicht die Zeit, die sich das Gerät in einem S...
  • Wenn DIPM ausgeschaltet ist, muss der aufgezeichnete Wert mit der Taktzeit übereinstimmen, da alle drei Gerätezustände gezählt werden: aktiv,im Leerlauf und Sholzber.

0C

Anzahl der Leistungszyklen

Der Rohwert gibt die kumulative Anzahl von Energiezyklusereignissen (Ein-/Ausschaltzyklen) während der Lebensdauer des Geräts an.

Aa

Einentgleisbarer reservierter Platz

Gibt die Anzahl der verbleibenden Reserveblöcke an. Der normalisierte Wert beginnt bei 100 (64 Stunden), was der Verfügbarkeit des reservierten Speicherplatzes um 100 Prozent entspricht. Der Schwellenwert für dieses Attribut ist 10 Prozent Verfügbarkeit.

AB

Anzahl der Programm-Fehlschlägts

Der Rohwert zeigt die Gesamtanzahl des Fehlschlägts des Programms an. Der normalisierte Wert, der bei 100 beginnt, zeigt den Prozentwert, der vom verbleibenden zulässigen Programm ausfällt.

Ac

Anzahl der Löschungen (Fail Count)

Der Rohwert zeigt die Gesamtanzahl des Löschens als fehlgeschlagen an. Der normalisierte Wert, der bei 100 beginnt, zeigt den Verbleibenden des zulässigen Löschens(Fails) an.

Ae

Unerwarteter Stromausfall

Meldet die Anzahl unreiner Herunterfahren, kumulativ über die Lebensdauer des SSD. Ein "unreines Herunterfahren" ist das Entfernen des Stroms ohne STANDBY IMMEDIATE als letzten Befehl (unabhängig von der PLI-Aktivität unter Einsatz der Kondensatorleistung). Wird auch als "Power-off Retract Count" (Ausschalten der Retract-Anzahl) pro Magnetischem Laufwerk bezeichnet.

B8

Anzahl der End-to-End-Fehlererkennung

Meldet die Anzahl der Fehler, die während der LBA-Tag-Prüfungen (Logical Block Address) innerhalb des SSD-Datenpfads aufgetreten sind. Der normalisierte Wert beginnt bei 100 und decrements by 1 für jedes erkannte LBA-Tag-Mismatch. Der Schwellenwert ist 90.

Bb

Nicht korrigierbare Fehleranzahl

Der Rohwert zeigt die Anzahl der Fehler an, die mit dem Error Correction Code (ECC) nicht wiederhergestellt werden konnten.

Werden

Temperatur – Luftstrom (Gehäuse)

Meldet die SSD-Falltemperatur in Grad Celsius. Der Rohwert ist wie folgt:

  • Byte 0 = Aktuelle Falltemperatur (° C)
  • Byte 2 = Neueste Mindestfalltemperatur (° C)
  • Byte 3 = Letzte maximale Falltemperatur (° C)

Der normalisierte Wert ist 100. Die Falltemperatur wird basierend auf einem Offset vom internen Temperatursensor berechnet.

C0

Anzahl der nicht sicheren Herunterfahren (Anzahl der ausgeschalteten Retracts)

Der Rohwert gibt die kumulierte Anzahl von nicht sicheren (unreinen) Herunterfahren-Ereignissen während der Lebensdauer des Geräts an. Ein unsicheres Herunterfahren tritt auf, wenn das Gerät ausgeschaltet wird, ohne dass STANDBY IMMEDIATE der letzte Befehl ist.

C2

Temperatur – internes Gerät

Meldet die interne Temperatur des SSD. Die Temperatur ablesen ist der Wert direkt vom internen Sensor. Der Rohwert ist die aktuelle Temperatur. Der normalisierte Wert ist das Ergebnis, das (mind. 150-aktuelle Temp, 100) erzielt wird.

C7

ANZAHL DER CRC-Fehler

Die Gesamtanzahl der aufgetretenen SATA-Schnittstellen-Redundanzcheck-Fehler (CRC).

E1

Host-Schreibvorgänge

Der Rohwert gibt die Gesamtzahl der vom Host-System geschriebenen Sektoren an. Der Rohwert steigt um 1 für alle 65.536 vom Host geschriebenen Sektoren.

E2

Zeitarbeitslast, Medienverschleiß

Misst den Verschleiß, den das SSD (seit dem Zurücksetzen des Timed Workload Timer, Attribut E4) in Prozent der maximalen Nennzyklen sieht.

E3

Zeitarbeitslast, Host-Lese-/Schreib-Verhältnis

Der Prozentuale Anteil der I/O-Vorgänge, die Lesevorgänge sind (seit dem Zurücksetzen des Timed Workload Timer, Attribut E4).

E4

Timed Workload Timer

Misst die seit dem Starten dieses Workload-Timers verstrichene Zeit (Anzahl von Minuten).

E8

Verfügbarer reservierter Speicherplatz

Gibt die Anzahl der verbleibenden Reserveblöcke an. Der normalisierte Wert beginnt bei 100 (64 Stunden), was der Verfügbarkeit des reservierten Speicherplatzes um 100 Prozent entspricht. Der Schwellenwert für dieses Attribut ist 10 Prozent Verfügbarkeit.

E9

Medienverschleiß-Indikator

Gibt die Anzahl der Zyklen an, die den NAND-Medien unterzogen wurden. Der normalisierte Wert wird linear von 100 auf 1 sinken, wenn die durchschnittliche Anzahl der Löschungszyklen von 0 auf die maximalen Nennzyklen ansteigt. Sobald der normalisierte Wert 1 erreicht hat, wird die Zahl nicht sinken, obwohl es wahrscheinlich ist, dass ein erheblicher zusätzlicher Verschleiß auf dem Gerät erzielt werden kann.

F1

Gesamte geschriebene LBAs

Zählt sektoren, die vom Host geschrieben wurden.

F2

Gelesene LBAs insgesamt

Zählt Vom Host gelesene Sektoren.

SMART-Attribute für NVMe*

Id

Attribut und Beschreibung (NVMe)

0

Kritische Warnung

Wenn diese Bits gesetzt sind, kennzeichnen Sie verschiedene Warnquellen.

  • Bit 0: Verfügbarer Ersatz liegt unterhalb des Schwellenwerts
  • Bit 1: Temperatur hat Schwellenwert überschritten
  • Bit 2: Zuverlässigkeit wird aufgrund übermäßiger Medien oder interner Fehler beeinträchtigt
  • Bit 3: Medien werden im Lesemodus platziert
  • Bit 4: Volatile Memory Backup System ist fehlgeschlagen (z. B. Testfehler des erweiterten Verlustkondensators)
  • Bits 5-7: Vorbehalten

Jede der kritischen Warnungen kann mit der Benachrichtigung über Ereignisse in Verbindung mit Nichterzungsereignis verknüpft sein.

1

Temperatur

Gibt die aktuelle Gesamttemperatur des Geräts in Kelvin an.

3

Ersatz erhältlich

Enthält einen normalisierten Prozentsatz (0 bis 100 %) der verbleibenden verfügbaren Ersatzkapazität. Beginnt bei 100 und Dekrementen.

4

Verfügbarer Ersatzschwellwert

Der Schwellenwert ist auf 10 % festgelegt.

5

Geschätzter Anteil in Prozent

(Der Wert darf nicht länger als 100 % sein). Ein Wert von 100 deutet darauf hin, dass die geschätzte Lebensdauer des Geräts verbraucht wurde, weist jedoch möglicherweise nicht auf einen Geräteausfall hin. Der Wert darf nicht länger als 100 sein. Prozentsätze über 254 werden als 255 dargestellt. Dieser Wert muss einmal pro Ein-/Aus-Stunde aktualisiert werden (wenn sich der Controller nicht in einem Ruhezustand befindet).

32

Lesegeräte (in LBAs)

Enthält die Anzahl von 512 Byte-Dateneinheiten, die der Host vom Controller gelesen hat; dieser Wert umfasst keine Metadaten. Dieser Wert wird in Tausenden angegeben (d. h. ein Wert von 1 entspricht 1.000 Einheiten von 512 gelesenen Byte) und ist eine Wertsteigerung. Wenn die LBA-Größe einen anderen Wert als 512 Byte beträgt, konvertiert der Controller die gelesene Datenmenge in 512 Byte-Einheiten.

48

Schreibzugriffe von Dateneinheiten (in LBAs)

Enthält die Anzahl der 512 Byte-Dateneinheiten, die der Host in den Controller geschrieben hat; dieser Wert umfasst keine Metadaten. Dieser Wert wird in Tausenden angegeben (d. h. ein Wert von 1 entspricht 1 1000 Einheiten von 512 geschriebenen Byte) und ist 1000 Geschriebene. Wenn die LBA-Größe einen anderen Wert als 512 Byte beträgt, konvertiert der Controller die menge der in 512 Byte-Einheiten geschriebenen Daten. Für den NVM-Befehlssatz müssen logische Blocks, die als Teil von Schreibvorgängen geschrieben werden, in diesen Wert aufgenommen werden. Das Schreiben von nicht korrigierbaren Befehlen hat keinen Einfluss auf diesen Wert.

64

Host-Lesebefehle

Enthält die Anzahl der Lesebefehle, die an den Controller ausgegeben werden.

80

Host-Schreibbefehle

Enthält die Anzahl der Schreibbefehle, die an den Controller ausgegeben werden.

96

Controller Busy Time (in Minuten)

Enthält die Zeit, die der Controller mit I/O-Befehlen beschäftigt. Der Controller ist beschäftigt, wenn für eine I/O-Warteschlange ein Befehl ausstehend ist. (Insbesondere wurde ein Befehl über eine I/O-Einreichungsliste mit Türschwanz-Schreibzugriff ausgegeben, und der entsprechende Fertigstellungswarteschlangeneintrag wurde noch nicht in der entsprechenden I/O-Completion-Warteschlange veröffentlicht.) Dieser Wert wird in Minuten gemeldet.

112

Energiezyklen

Enthält die Anzahl der Ein-/Aus-Zyklen

128

Ein-/Aus-Stunden

Enthält die Anzahl der Ein-/Aus-Stunden. Dies umfasst nicht die Zeit, während der der Controller mit Strom versorgt wurde und sich in einem Zustand mit geringem Stromverbrauch befindet.

144

Unsichere Herunterfahren

Enthält die Anzahl der nicht sicheren Herunterfahren. Diese Anzahl wird erhöht, wenn keine Shutdown-Benachrichtigung (CC.SHN) eingegangen ist, bevor der Strom verloren geht.

160

Medienfehler

Enthält die Anzahl der Fehler, bei denen der Controller einen nicht wiederhergestellten Datenintegritätsfehler erkannt hat. In diesem Feld sind Fehler wie nicht korrigierbare ECC-, CRC-Prüfsummenfehler oder nicht übereinstimmende LBA-Markierungen enthalten.

176

Anzahl der Fehlerinformationen-Protokolleinträge

Enthält die Anzahl der Fehlerinformationen-Protokolleinträge während der Lebensdauer des Controllers.

192

Warnung: Composite Temperaturzeit

Enthält die Zeit in Minuten, die der Controller in Betrieb ist, und die Composite Temperature ist größer oder gleich dem Warn-Composite-Temperaturschwellenwert (WCTEMP)-Feld und geringer als das Feld Critical Composite Temperature Threshold (CCTEMP) in der Datenstruktur für den Identifizieren des Controllers.

196

Kritische Composite Temperaturzeit

Enthält die Zeit in Minuten, die der Controller in Betrieb ist, und die Composite Temperature ist größer als das Feld Critical Composite Temperature Threshold (CCTEMP) in der Struktur der Identifizieren des Controller-Daten.

Disclaimer

1

Alle Posts und die Nutzung der Inhalte auf dieser Website unterliegen den Intel.com Nutzungsbedingungen.

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.