Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Warum ist die Ladezeit des Modells zur GPU länger als zur CPU?

Inhaltstyp: Wartung und Leistung   |   Artikel-ID: 000057525   |   Zuletzt angesehen: 05.03.2026

Umwelt

OpenVINO™-Toolkit GPU-Plugin CPU Plugin

Beschreibung

Das Laden der Intermediate Representation (IR) eines Eingabemodells in die GPU dauert länger als das Laden desselben Modells in eine CPU.

Auflösung

Erstellen Sie manuell cl_cache Verzeichnis im Arbeitsverzeichnis Ihrer Anwendung.

Der Treiber verwendet dieses Verzeichnis, um die binären Darstellungen der kompilierten Kernel zu speichern. Dies funktioniert auf allen unterstützten Betriebssystemen.

Legen Sie alternativ die Umgebungsvariable fest:

export INTEL_OPENCL_CACHE=1

Weitere Informationen

In diesem Artikel finden Sie eine Übersicht über das Modell-Caching, um die Latenz zu optimieren.

Das Laden des Eingabemodells im IR-Format (Intermediate Representation) in die GPU dauert länger als das Laden desselben Modells auf eine CPU, da der GPU-Stack auf OpenCL* basiert. Die Ladezeit hängt von der Kompilierungszeit der OpenCL*-Kernel ab.

Wenn Sie die cl_cache aktivieren, dauert es beim ersten Laden des Modells immer noch lange, da der OpenCL*-Kernel kompiliert wird. Jede nachfolgende Ladung desselben Modells ist jedoch viel schneller.

Für die programmgesteuerte Cachekonfiguration in OpenVINO™ 2026.0:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

Weitere Informationen

OpenVINO™ 2026.0 GPU Plugin – Dokumentation

Zugehörige Produkte

Dieser Artikel bezieht sich auf 1 Produkte.

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.