Artikel-ID: 000088030 Inhaltstyp: Fehlerbehebung Letzte Überprüfung: 15.05.2023

Warum wirkt sich die Anwendung verschiedener Gewichte auf ein Modell auf die Inferenzleistung aus?

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Zusammenfassung

Abgewogene Verwendung verschiedener Daten- und Gewichtformate

Beschreibung
  1. Generieren Sie zwei IR-Dateien (identische .xml-Datei , aber verschiedene .bin-Dateien )
  2. Ein ähnliches Modell mit unterschiedlichen Gewichten läuft mit verschiedenen fps (27 fps und 6 fps)
  3. Beeinflussen Gewichte, die unterschiedlicher sind, die Inferenzleistung bei Myriad X?
Lösung

Modellgewichte und Präzision (FP32, FP16, INT8) beeinflussen die Inferenzleistung.

Die Verwendung des FP32-Formats würde zur vollständigen Gewichtsverteilung führen und wird als Single Precision Floating Point bezeichnet.

Inzwischen sind FP16- und INT8-Formate beide komprimierte Gewichtsformate, wo sie verkleinert werden. Der Kompromiss für diese Komprimierungen ist die Genauigkeit des Modells oder auch als Quantisierungsfehler bekannt.

Je mehr Bits für die Darstellung von Daten zugewiesen werden, desto größer ist der Bereich, den sie darstellen könnten, und möglicherweise die bessere Genauigkeit des Modells. Größere Daten erfordern jedoch größeren Speicherplatz für seinen Datenspeicher, eine höhere Speicherbandbreite, die für die Übertragung benötigt wird, und mehr Rechenressourcen und zeitaufgebrauchte Zeit.

Die Intel® Distribution des OpenVINO™ Toolkit Benchmarkergebnisse zeigen offensichtliche Unterschiede in der Leistung zwischen verschiedenen Gewichtsformaten oder der Präzision.

Zugehörige Produkte

Dieser Artikel bezieht sich auf 2 Produkte

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.