Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Konvertierung von INT8-Modellen in Intermediate Representation (IR)

Inhaltstyp: Fehlerbehebung   |   Artikel-ID: 000058759   |   Zuletzt angesehen: 05.03.2026

Beschreibung

In der Dokumentation zur Modelloptimierung wird quantisierungsfähiges Training (QAT) erwähnt. Es besagt, dass QAT es einem Benutzer ermöglicht, ein genaues, optimiertes Modell zu erhalten, das in OpenVINO™ Intermediate Representation (IR) konvertiert werden kann. Es werden jedoch keine weiteren Details angegeben. Siehe auch:

Auflösung

Quantization-Aware Training (QAT) mit OpenVINO™-kompatiblen Trainingsframeworks wird durch das Neural Network Compression Framework (NNCF) unterstützt für:

  • TensorFlow* 2 / Keras*-Modelle (über NNCF QAT-Workflow)
  • PyTorch*-Modelle (über NNCF QAT-Workflow)

NNCF ist ein Framework, das Modellkomprimierungsmethoden nach dem Training und zur Trainingszeit (einschließlich QAT) bereitstellt und zur Optimierung von Modellen für OpenVINO Inferenz verwendet wird.

Nach Abschluss der QAT-Feinabstimmung kann das optimierte Modell exportiert werden (in der Regel nach ONNX*) und dann für die Bereitstellung in OpenVINO™ IR konvertiert werden.

HinweisDer Übergang zur INT8-Präzision und die entsprechenden Platzbedarfsvorteile erfolgen nach der Konvertierung des Modells in OpenVINO IR.

Zugehörige Produkte

Dieser Artikel bezieht sich auf 1 Produkte.

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.