Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Warum ist die Ladezeit des Modells auf die GPU länger als auf die CPU?

Inhaltstyp: Wartung und Leistung   |   Artikel-ID: 000057525   |   Letzte Überprüfung: 31.01.2023

Umgebung

OpenVINO™ Toolkit GPU-Plugin CPU-Plugin

Beschreibung

Das Laden des Intermediate Representation (IR) eines Eingabemodells auf die GPU dauert länger, als das Laden des gleichen Modells auf eine CPU.

Lösung

Erstellen Sie cl_cache Verzeichnis manuell im Arbeitsverzeichnis Ihrer Anwendung.

Der Treiber verwendet dieses Verzeichnis, um die binären Darstellungen der kompilierten Kernel zu speichern. Dies funktioniert auf allen unterstützten OSes.

Weitere Informationen

In diesem Artikel finden Sie weitere Informationen zur Verwaltung der cl_cache.

Das Laden Ihres Eingabemodells im Ir-Format (Intermediate Representation) auf die GPU dauert länger als das Laden des gleichen Modells auf eine CPU, da der GPU-Stack auf OpenCL* basiert. Die Ladezeit hängt von der Kompilierungszeit von OpenCL* Kernels ab.

Wenn Sie die cl_cache aktivieren, dauert es beim ersten Laden des Modells immer noch lange, da der OpenCL*-Kernel kompiliert wird. Jede nachfolgende Last des gleichen Modells ist jedoch viel schneller.

Zugehörige Produkte

Dieser Artikel bezieht sich auf 2-Produkte.

Nicht mehr lieferbare Produkte

Intel® DevCloud for the Edge

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.