Artikel-ID: 000057525 Inhaltstyp: Wartung und Leistung Letzte Überprüfung: 31.01.2023

Warum ist die Ladezeit des Modells auf die GPU länger als auf die CPU?

Umgebung

OpenVINO™ Toolkit GPU-Plugin CPU-Plugin

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Zusammenfassung

Schneller Schritt zur Verbesserung der Modellladezeit auf GPU

Beschreibung

Das Laden des Intermediate Representation (IR) eines Eingabemodells auf die GPU dauert länger, als das Laden des gleichen Modells auf eine CPU.

Lösung

Erstellen Sie cl_cache Verzeichnis manuell im Arbeitsverzeichnis Ihrer Anwendung.

Der Treiber verwendet dieses Verzeichnis, um die binären Darstellungen der kompilierten Kernel zu speichern. Dies funktioniert auf allen unterstützten OSes.

Weitere Informationen

In diesem Artikel finden Sie weitere Informationen zur Verwaltung der cl_cache.

Das Laden Ihres Eingabemodells im Ir-Format (Intermediate Representation) auf die GPU dauert länger als das Laden des gleichen Modells auf eine CPU, da der GPU-Stack auf OpenCL* basiert. Die Ladezeit hängt von der Kompilierungszeit von OpenCL* Kernels ab.

Wenn Sie die cl_cache aktivieren, dauert es beim ersten Laden des Modells immer noch lange, da der OpenCL*-Kernel kompiliert wird. Jede nachfolgende Last des gleichen Modells ist jedoch viel schneller.

Zugehörige Produkte

Dieser Artikel bezieht sich auf 2 Produkte

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.