Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Warum sind sowohl die Latenz als auch der Durchsatz höher, wenn das Inferenzmodell mit OpenVINO™ Benchmark für die GPU im Vergleich zur CPU arbeitet?

Inhaltstyp: Produktinformationen und Dokumente   |   Artikel-ID: 000093152   |   Letzte Überprüfung: 09.02.2023

Beschreibung

  • Das gleiche Modell wurde mit OpenVINO™ Benchmark für CPU und GPU abgeleitet:
    benchmark_app.exe -m model.xml -d CPU
    benchmark_app.exe -m model.xml -d CPU
  • Die resultierende Latenz und der Durchsatz bei der GPU sind höher als bei der CPU.
  • Es konnte nicht ermittelt werden, warum sowohl die Latenz als auch der Durchsatz der Inferenz auf der GPU höher als die CPU sind, da niedrige Latenz zu einem hohen Durchsatz führt.

Lösung

Die Latenz misst die Inferenzzeit, die für die Verarbeitung einer einzelnen Eingabe erforderlich ist, wenn die Inferenz synchron erfolgt.

Bei der Ausführung von OpenVINO™ Benchmark mit Standardparametern wird im Modus "Inferenz" eine Inferenzierung durchgeführt. Aus diesem Grund misst die resultierende Latenz die gesamte Inferenzzeit, die für die Verarbeitung der Anzahl der Inferenzanfragen erforderlich ist.

Darüber hinaus werden bei der Ausführung von Benchmark App auf der CPU mit Standardparametern 4 Inferenzanforderungen erstellt, während 16 Inferenzanfragen erstellt werden, wenn die Benchmark App auf GPU mit Standardparametern ausgeführt wird. Daher ist die resultierende Latenz von Inferenzierung auf GPU höher als bei der CPU.

Geben Sie für einen fairen Vergleich die gleiche Anzahl von Inferenzanfragen an, wenn Sie Benchmark App auf CPU und GPU ausführen:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

Zugehörige Produkte

Dieser Artikel bezieht sich auf 3-Produkte.
Software für Intel® Xeon Phi™ Prozessor OpenVINO™ toolkit Performance-Bibliotheken

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.