Beschreibt die OpenCL-Eigenschaft CL_DEVICE_MAX_WORK_ITEM_SIZES und ob neuere Intel-Grafikprodukte eine bessere Leistung für paralleles Computing bieten.
- Hat Intel® Iris® Xe Grafik mehr Arbeitselemente oder Threads als Intel® UHD-Grafik?
- Auf der Suche nach der besten Intel® Grafik für parallele Berechnungen.
- Geben Sie den Befehl "clinfo" in Linux mit OpenCL ein:
- Intel Iris Xe Graphics hat insgesamt 96 Ausführungseinheiten (EUs) oder Threads, viermal mehr als die Intel UHD-Grafik mit 24.
- Die maximale Arbeitsaufgabengröße aus der obigen Abbildung ist ein Wert einer Eigenschaft namens CL_DEVICE_MAX_WORK_ITEM_SIZES aus den OpenCL 2.1-Spezifikationen:
Maximale Anzahl von Arbeitsaufgaben, die in jeder Dimension der Arbeitsgruppe für clEnqueueNDRangeKernel angegeben werden können.
Gibt n size_t Einträge zurück, wobei n der Wert ist, der von der Abfrage für CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS zurückgegeben wird.
Der Mindestwert ist (1, 1, 1) für Geräte, die nicht vom Typ CL_DEVICE_TYPE_CUSTOM sind. - Dies bedeutet nicht, dass der Computer 256 * 256 * 256 = 16777216 Arbeitselemente in einer Arbeitsgruppe haben und 16777216 Threads parallel ausführen kann.
- Die CL_DEVICE_MAX_COMPUTE_UNITS-Eigenschaft gibt an, dass der Computer insgesamt 24 Ausführungseinheiten (EUs) hat.
- Jeder Thread kann entweder in SIMD8-, SIMD16- oder SIMD32-Lanes ausgeführt werden, wobei SIMD vom Kernel und der Art und Weise, wie er vom Compiler erstellt wurde, abhängt.
- Jede einzelne EU verfügt über 7 Hardware-Threads (für Intel-Grafik der 6. Generation).
- Die theoretische maximale Anzahl von OpenCL-Threads für diese Plattform beträgt 24*7*32 = 5376.
- Es wird von 168 HW-Threads gehandhabt, vorausgesetzt, dass ein bestimmter Kernel im SIMD32-Modus erstellt wird.
Die Anzahl der EUs für ein bestimmtes Produkt finden Sie auf unserer Seite mit den Grafikspezifikationen.
Beispielsweise werden im Abschnitt Prozessorgrafik für den i7-11370H Prozessor 96 EU angezeigt.