Intel® Xeon Phi™ Product Family

Power your breakthrough innovations with the highly parallel processing of the Intel® Xeon Phi™ coprocessor. We have packed over a teraFLOPS of double-precision peak performance into every chip.

Life science applications

Life sciences is one of the largest commercial market segments for high-performance computing. Life sciences includes many disciplines, such as chemistry, bio-chemistry, molecular modeling, protein folding, genomics, and statistical analysis to name a few. Quick simulation and analysis leads to breakthroughs in all areas of the life sciences. BWA maps human genomes. Gromacs simulates particle molecular dynamics. LAMMPS is a versatile large scale atomic simulation package. MPI-HMMER is an open source MPI implementation of the HMMER protein sequence analysis suite. NAMD is a parallel molecular dynamics code for large bio molecular systems.

Developer starter kits >

Intel measured as of May 2014

BWA: (Burrow-Wheeler Aligner Release bwa-0.5.10)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel® Software Development Platform: two Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel® QuickPath Interconnect (Intel® QPI), 130 W thermal design power (TDP), Intel® Turbo Boost Technology on, Intel® Hyper-Threading Technology (Intel® HT Technology) on) 64 GB memory at 1600 MHz, Red Hat Enterprise Linux* (RHEL*) 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (Intel® Turbo Boost Technology off, error-correcting code (ECC) on)

Software stack (Intel Xeon Phi coprocessor):

Intel® Manycore Platform Software Stack (Intel® MPSS) 2.1.6720-21 (Flash*: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel® MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 178.73 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 119.17 seconds

Source: Intel Internal Testing TR2093

 

MPIHmmer:

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: two Intel Xeon processor E5-2670 (8 core, 20M cache, 2.6 GHz, 8.0 GT/s Intel QPI, 115 W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386; coprocessor OS: 2.6.38.8-g5f2543d)

Intel® Composer XE 2013.3.163

Two-socket Intel Xeon processor score: 89 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 57 seconds

Source: Intel Internal Testing TR2051

 

LAMMPS (Production Protein Simulation 474K Stoms, Version 5 April 2014)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: two Intel Xeon processor E5-2697 v2 (2x 12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 135 W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.3

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386)

Intel® Compiler 14.0.1; Intel MPI Library 4.1.2.040

 

1 Node

16 Nodes

Two-socket Intel® Xeon® processor score:

26.84 sec

4.33 seconds

Two-socket Intel Xeon processor + Intel® Xeon Phi™ coprocessor score:

19.10 sec

2.63 seconds

Source: Intel Internal Testing TR2104

 

GROMACS  (Version 5.0-rc1 - Workload 512K H20 with RF Method)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: two Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130 W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 2.312 ns/day

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 3.605 ns/day seconds

Source: Intel Internal Testing TR2101

 

NAMD: (STMV 2.10 pre-release)

Platform hosting the coprocessor and platform for 2S Intel® Xeon® processor baseline:

Intel® Workstation Board W2600CR2 platform: two Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130 W TDP, Intel Turbo Boost Technology on, Intel HT Technology on)  64 GB memory at 1600 MHz, RHEL 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

MPSS 2.1.6720-21 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel Compiler 13.1.3 20130607

Two-socket Intel Xeon processor score: 0.513 seconds

Two-socket Intel Xeon processor + 2 Intel Xeon Phi coprocessor score: 0.158 seconds

Source: Internal Testing (TR 2100)

 

NAMD STMV 1 node 47 PPN per node

(Version 2.10 pre-release)

STMV (virus) benchmark (1,066,628 atoms, periodic, PME)

Platform hosting the coprocessor:

Intel Workstation Board W2600CR2 platform: two Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130 W TDP)  64 GB memory at 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (ECC on, Intel Turbo Boost Technology off)

NVIDIA K40c* GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory at 6.0 GT/s, ECC on, 235 W TDP

CUDA* 5.5.0, Driver 319.82 (boost frequency was not enabled for result)

Software stack:

Intel MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel® Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

4 Nodes

 

2S Intel® Xeon® processor only score:

0.158 ns/day

     

2S Intel Xeon processor + 1 Intel® Xeon Phi™ coprocessor score:

0.386 ns/day

0.729 ns/day

1.2879 ns/day

(higher is better)

2S Intel Xeon processor + 2 Intel Xeon Phi coprocessor score:

0.512 ns/day

     

NVIDIA K40c* score:

0.32 ns/day

0.55 ns/day

1.02 ns/day

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR* (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

 

NAMD ApoA1 1 node (47 PPN per node)

Version 2.10 pre-release

Platform hosting the coprocessor:

Intel Workstation Board W2600CR2 platform: two Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130 W TDP) 64 GB memory at 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300 W TDP C-step (ECC on, Turbo off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory at 6.0GT/s, ECC on, 235 W TDP

CUDA 5.5.0, Driver 319.82 (boost frequency was not enabled for result)

Software stack:

Intel MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel® Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

 

2S Intel® Xeon® processor + 1 Intel® Xeon Phi™ coprocessor score (symmetric):

4.430 Mrps

6.607 Mrps

(higher is better)

NVIDIA K40c* score:

4.08 Mrps

6.16 Mrps

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

Additional information: 1 2 3 4 5

Videos >

Produkt- und Leistungsinformationen

1

In Leistungstests verwendete Software und Workloads können speziell für die Leistungseigenschaften von Intel® Mikroprozessoren optimiert worden sein. Leistungstests, wie SYSmark und MobileMark, werden mit spezifischen Computersystemen, Komponenten, Softwareprogrammen, Operationen und Funktionen durchgeführt. Jede Veränderung bei einem dieser Faktoren kann andere Ergebnisse zur Folge haben. Als Unterstützung für eine umfassende Bewertung Ihrer vorgesehenen Anschaffung, auch im Hinblick auf die Leistung des betreffenden Produkts in Verbindung mit anderen Produkten, sollten Sie noch andere Informationen und Leistungstests heranziehen. Weitere Informationen siehe www.intel.com/performance.

2

Intel hat keinen Einfluss auf und keine Aufsicht über die Entwicklung oder Implementierung von Benchmarktests oder Websites Dritter, auf die in diesem Dokument Bezug genommen wird. Intel empfiehlt seinen Kunden, die genannten Websites oder weitere Websites zu besuchen, auf denen über ähnliche Leistungsbenchmarks berichtet wird, um sich davon zu überzeugen, dass die angeführten Benchmarks zutreffen und sie die Leistung im Handel befindlicher Systeme wiedergeben.

3

Intel Prozessornummern sind kein Maß für die Leistung. Prozessornummern unterscheiden Merkmale innerhalb einer jeweiligen Prozessorreihe, nicht jedoch bei verschiedenen Prozessorreihen. Weitere Einzelheiten siehe www.intel.com/content/www/de/de/processors/processor-numbers.html.

4

Unter Umständen können Intel® Compiler bei Optimierungen, die nicht spezifisch für Mikroprozessoren von Intel sind, das gleiche Optimierungsniveau auch für nicht von Intel stammende Mikroprozessoren bieten. Zu diesen Optimierungen gehören Befehlssätze für SSE2 und SSE3 sowie weitere Optimierungen. Intel übernimmt keine Garantie für die Verfügbarkeit, Funktionalität oder Effektivität von Optimierungen für Mikroprozessoren, die nicht von Intel hergestellt wurden.

Mikroprozessor-abhängige Optimierungen in diesem Produkt sind für die Verwendung mit Intel Mikroprozessoren bestimmt. Bestimmte, nicht für die Intel-Mikroarchitektur spezifische Optimierungen sind für Intel® Mikroprozessoren reserviert. Entnehmen Sie weitere Informationen zu den spezifischen Befehlssatzerweiterungen, auf die dieser Hinweis zutrifft, bitte den entsprechenden Benutzer- und Referenzhandbüchern.

Revisionshinweis: 20110804

5

Für unterschiedliche Hardware-Architekturen kann unterschiedlicher Quellcode erforderlich sein. Um die Ergebnisse zu erhalten, wählte Intel mit größtmöglicher Sorgfalt Code aus, der dafür optimiert ist, dieselben Aufgaben auf allen Plattformen auszuführen. Zukünftige Code-Optimierungen können zu anderen Ergebnissen führen.

Mikroprozessor-abhängige Optimierungen in diesem Produkt sind für die Anwendung in Verbindung mit Intel® Mikroprozessoren bestimmt. Bestimmte, nicht für die Intel-Mikroarchitektur spezifische Optimierungen sind für Intel® Mikroprozessoren reserviert. Entnehmen Sie weitere Informationen zu den spezifischen Befehlssatzerweiterungen, auf die dieser Hinweis zutrifft, bitte den entsprechenden Benutzer- und Referenzhandbüchern.

Revisionshinweis: 20110804