Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Warum sollten Sie sich für das FP16-Modell bei der Gewichtskompression mit dem optimalen Intel / Neural Network Compression Framework (NNCF) entscheiden?

Inhaltstyp: Fehlerbehebung   |   Artikel-ID: 000098174   |   Letzte Überprüfung: 21.03.2024

Beschreibung

Der Grund für die Wahl des FP16-Modells in der Gewichtskompression mit Optimum Intel / NNCF kann nicht ermittelt werden.

Lösung

Die FP16-Halbpräzision, wodurch die Modellgröße der FP32-Präzision halbiert wird, kann bei Verwendung der Hälfte der GPU-Ressourcen ein nahezu identisches Inferenzergebnis erzielen.

Zugehörige Produkte

Dieser Artikel bezieht sich auf 1-Produkte.

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.