Zum Hauptinhalt wechseln
Support-Wissensdatenbank

Wie ist der Zusammenhang zwischen der Komplexität eines Modells und seinem Inferenzdurchsatz?

Inhaltstyp: Produktinformationen und Dokumente   |   Artikel-ID: 000059690   |   Zuletzt angesehen: 09.03.2026

Umwelt

NCS2

Beschreibung

Es konnte nicht festgestellt werden, warum das Benchmark-Tool ähnliche Inferenz-FPS für zwei Modelle mit sehr unterschiedlicher Komplexität meldet, die durch Giga Floating Point Operations (GFLOPs) definiert wird.

Auflösung

  • Eine höhere Anzahl von FLOPs ist direkt proportional zu einer reduzierten Anzahl von FPS. Es gibt jedoch keinen fairen Vergleich zwischen FPS und FLOPs.
  • Faktoren, die die vom Benchmark-Tool erhaltenen FPS beeinflussen können:
    • Im synchronen und asynchronen Modus ausführen
    • Anzahl der Streams
    • Anzahl der Inferenzanfragen

Zugehörige Produkte

Dieser Artikel bezieht sich auf 1 Produkte.

Disclaimer / Rechtliche Hinweise

Der Inhalt dieser Seite ist eine Kombination aus menschlicher und computerbasierter Übersetzung des originalen, englischsprachigen Inhalts. Dieser Inhalt wird zum besseren Verständnis und nur zur allgemeinen Information bereitgestellt und sollte nicht als vollständig oder fehlerfrei betrachtet werden. Sollte eine Diskrepanz zwischen der englischsprachigen Version dieser Seite und der Übersetzung auftreten, gilt die englische Version. Englische Version dieser Seite anzeigen.