Larrabee (GPU)

Larrabee ist der Codename für eine Grafikkartengeneration von Intel. Der darauf basierende Koprozessor erschien 2012 unter der Bezeichnung Intel Xeon Phi.

Larrabee sollte ursprünglich Ende 2009 oder Anfang 2010 auf den Markt kommen. Im Dezember 2009 bestätigte Intel, dass keine Produkte auf Basis der ersten Generation des Larrabee auf den Markt kommen werden.^[1] Im Sommer 2012 stellte Intel auf Basis der weiter entwickelten Larrabee-Architektur die MIC-Karte (Many Integrated Core) als Coprozessor unter dem Namen „Intel Xeon Phi“ vor.^[2]

Die ersten Prozessoren der zweiten Generation (Codename „Knights Corner“) erschienen in Form von zwei PCI-Express-Steckkarten mit den Namen „Xeon Phi 5110P“ und „Xeon Phi 3100“.

Larrabee

Im Januar 2007 bestätigte Intel erstmals offiziell die Existenz des Larrabee-Projekts.^[3] Allerdings wurde zu diesem Zeitpunkt noch nicht bekannt gegeben, worum es sich dabei handelt. Erst auf dem Intel Developer Forum im April 2007 verkündete der damalige Senior Vice President und General Manager von Intel, Patrick Gelsinger, dass es sich beim Larrabee um High-End-Grafikkarten auf Basis von „IA++“-Kernen handelt. Als Einsatzbereich gab Gelsinger wissenschaftliches Rechnen, Visualisierungen oder andere Anwendungen im Bereich Gesundheit und Analyse an.^[4]

Im Dezember 2009 verkündete Intel, dass zunächst keine Larrabee-Grafikkarten auf den Consumer-Markt gebracht werden.^[1] Als Gründe gab Intel an, dass Larrabee die Erwartungen sowohl im Software-, als auch im Hardwarebereich nicht erfüllt habe. Gleichzeitig führte man aus, dass für konkurrenzfähige Larrabeeprodukte ein ausgereifter 32-nm-Fertigungsprozess notwendig sei, was darauf hindeutet, dass die Leistungsaufnahme zu hoch gewesen sein muss oder/und die Taktraten zu niedrig waren. Im November 2009 führte Intel auf der Supercomputing-Messe einen übertakteten Larrabee mit einer Leistung von über einem Tera-FLOPS vor. Allerdings wurden diese Leistungsbereiche schon im Sommer 2008 von der Radeon HD 4870 oder Geforce GTX 280 erreicht. Intel bestätigte, dass Larrabee als reines Forschungsprojekt fortgeführt werde, um die Softwareentwicklung des „Larrabee 2“ zu unterstützen.^[1]

Xeon Phi

Knights-Ferry-Prototyp

Intel verwendet als Prototyp einen Pentium-P54C-basierten Prozessorkern, der auf 45-nm-Technik „geschrumpft“ wird, mit den 64-Bit-Erweiterungen sowie AVX-512-Erweiterungen ausgestattet wird, und baut einen Cluster von vielen solchen Kernen mit gemeinsamer Cache-Verwaltung auf einem Chip auf (MIC = „Many Integrated Core“-Konzept). Der Chip kommt nie in den Handel, da er vermutlich als Grafikprozessor gegenüber den hochentwickelten Konkurrenzprodukten von ATI, AMD und Nvidia nicht konkurrenzfähig ist.

Knights-Corner-x100-Co-Prozessor-Familie

Das MIC-Konzept hat sich zwar nicht als Grafikprozessor bewährt, stellt aber einen sinnvollen Ansatz für „High Performance Computing“ dar, da sich im Bereich der Supercomputer das Parallelrechner-Konzept längst durchgesetzt hat. Hier ist der Kampf um Recheneffizienz entbrannt, Intel brauchte also einen Prozessorkern, der nicht auf Single-Task-Leistung optimiert ist, sondern auf geringen Energieverbrauch. Für diese Generation wurde die zu diesem Zeitpunkt aktuelle 22-nm-Lithografie verwendet, das MIC-Konzept blieb im Wesentlichen unverändert. 2012 erschienen mehrere PCI-Rechenbeschleunigerkarten, die in einige Supercomputer integriert wurden. Trotz aller Anstrengungen wurde diese Produktgeneration gegenüber dem Wettbewerber Nvidia mit den schon länger im Parallelrechnen etablierten Tesla-Karten kein kommerzieller Erfolg.

Produktname	Cache	Taktfrequenz	Anz. Cores	Erscheinungsdatum	TDP
Intel® Xeon Phi™ Coprocessor 3120A	6GB	1.100 GHz	57 core	Q2'13	300 W
Intel® Xeon Phi™ Coprocessor 3120P	6GB	1.100 GHz	57 core	Q2'13	300 W
Intel® Xeon Phi™ Coprocessor 5120D	8GB	1.053 GHz	60 core	Q2'13	245 W
Intel® Xeon Phi™ Coprocessor 5110P	8GB	1.053 GHz	60 core	Q4'12	225 W
Intel® Xeon Phi™ Coprocessor 7120A	16GB	1.238 GHz	61 core	Q2'14	300 W
Intel® Xeon Phi™ Coprocessor 7120D	16GB	1.238 GHz	61 core	Q1'14	270 W
Intel® Xeon Phi™ Coprocessor 7120P	16GB	1.238 GHz	61 core	Q2'13	300 W
Intel® Xeon Phi™ Coprocessor 7120X	16GB	1.238 GHz	61 core	Q2'13	300 W

Knights-Landing-x200-Familie

Diese Generation basiert auf einem Prozessorkern der Intel-Atom-Reihe, der auf 14-nm-Lithografie geschrumpfte Airmont, vormals Silvermont. Er enthält die Vektorbefehle AVX-512, ein Paket von SIMD-Befehlen, das bereits auf Befehlsebene eine Parallelisierung von 8 Zahlen doppelter Genauigkeit ermöglicht. Da die Atom-Kerne grundsätzlich auf geringen Energieverbrauch entwickelt sind (sie sollen ja in Mobilgeräten Verwendung finden), sind sie für das MIC-Konzept gut geeignet und fertig vorhanden.

Hier sollen nun grundsätzlich zwei Varianten verkauft werden:

eine PCI-E-Rechenbeschleunigerkarte
eine Reihe von Prozessor-Varianten, die sich genauso wie ein x86-64-Prozessor verhalten

Der neue Prozessor erhält einen LGA-3647 genannten Sockel 3647, der auch bei den kommenden Intel Xeon (Skylake)-Scalable-Prozessoren Verwendung finden wird. Dieser Sockel ermöglicht die Ansteuerung von insgesamt sechs DDR-4-Hauptspeicherkanälen. Zusätzlich wird es Knights-Landing-Varianten mit der neuen Intel Omni-Path-Verbindungs- bzw. -Clustertechnik geben, ein Intel-Wettbewerbsprodukt von InfiniBand.

Um einen Prozessorcluster mit bis zu 72 Kernen mit ausreichend Daten zu versorgen, so dass die Rechenleistung aller Kerne auch genutzt werden kann, sind hohe Bandbreiten zum Arbeitsspeicher erforderlich. Knights Landing hat deshalb diverse Optimierungen und Cache-Speicher^[5]:

Aufteilung der bis zu 72 Kerne in „Kacheln“ (Tiles) zu je zwei Kernen mit 1 MByte gemeinsamen 2nd-Level-Cachespeicher
alle Kacheln werden über ein „Ring“- bzw. „Mesh“-Netzwerk (Quelle hier unklar) mit zusammen 700 GB/sec Bandbreite mit den Arbeitsspeicherkanälen verbunden
Knights Landing besitzt 6 DDR4-2400-RAM-Kanäle mit zusammen 115,2 GB/sec Bandbreite für bis zu 384 GByte Arbeitsspeicher
nebst den 6 DDR4-RAM-Kanälen befinden sich noch 16 GByte MCDRAM („Multi Channel DRAM“, eine Form von HBM oder „High Bandwidth Memory“), aufgeteilt in 8 ICs und angebunden mit zusammen 450 GB/sec Bandbreite. Der MCDRAM kann wahlweise als Cache zum DDR4-Speicher oder als Zusatzspeicher konfiguriert werden.

Produktname	Cache	Taktfrequenz	Anz. Cores	Erscheinungsdatum	TDP
Intel® Xeon Phi™ Processor 7210	16GB	1,30 GHz	64 core	Q2'16	215 W
Intel® Xeon Phi™ Processor 7230	16GB	1,30 GHz	64 core	Q2'16	215 W
Intel® Xeon Phi™ Processor 7250	16GB	1,40 GHz	68 core	Q2'16	215 W
Intel® Xeon Phi™ Processor 7210F	16GB	1,30 GHz	64 core	Q4'16	230 W
Intel® Xeon Phi™ Processor 7230F	16GB	1,30 GHz	64 core	Q4'16	230 W
Intel® Xeon Phi™ Processor 7250F	16GB	1,40 GHz	68 core	Q4'16	230 W
Intel® Xeon Phi™ Processor 7290	16GB	1,50 GHz	72 core	Q3'16	245 W
Intel® Xeon Phi™ Processor 7290F	16GB	1,50 GHz	72 core	Q4'16	260 W

Knights-Mill-72x5-Familie

Im 4. Quartal 2017 wurde die Familie mit drei weiteren Prozessoren erweitert. Für Deep-Learning-Algorithmen werden neue AVX-512-Instruktionen eingeführt, die Integer-Operationen mit 8- und 16-Bit Breite ermöglichen und dort die Performance um einen Faktor 2 bzw. 4 steigern sollen

Produktname	Cache	Taktfrequenz	Anz. Cores	Erscheinungsdatum	TDP
Intel® Xeon Phi™ Processor 7235	16GB	1,30 GHz	64 core	Q4'17	250 W
Intel® Xeon Phi™ Processor 7285		1,30 GHz	68 core		250 W
Intel® Xeon Phi™ Processor 7295		1,50 GHz	72 core		320 W

Weitere Produktgenerationen (angekündigt unter dem Codenamen Knights Hill) wird es nicht mehr geben, Intel kündigt die gesamte Xeon-Phi-Baureihe ab.^[6]

Abgrenzung zu Intel Grafikprozessoren

Intels schon länger erhältliche GPUs, die im Chipsatz integriert waren (Intel GMA) wurden weiterentwickelt zu GPUs, die in die CPU selbst integriert sind und laufen jetzt unter dem Handelsnamen „Iris“ oder Intel HD Graphics. Es gibt ab der Intel-Sandy-Bridge-Mikroarchitektur in der Intel-Core-i-Serie jeweils Varianten mit oder ohne integrierte GPU.

Weblinks

Andreas Stiller: SC09: Intel demonstriert Larrabee mit über 1 Teraflops. In: heise online. 17. November 2009, abgerufen am 7. August 2021.
Bericht: Intel Larrabee-Architektur

Literatur

Larry Seiler u. a.: Larrabee: a many-core x86 architecture for visual computing. In: ACM Transactions on Graphics. Band 27, Nr. 3, 1. August 2008, S. 1–15, doi:10.1145/1360612.1360617.

Einzelnachweise

↑ ^a ^b ^c ComputerBase: Larrabee als Consumer-Grafikkarte ist Geschichte, Nachricht vom 5. Dezember 2009
↑ AnandTech: Intel Announces Xeon Phi Family of Co-Processors – MIC Goes Retail, Nachricht vom 19. Juni 2012
↑ ComputerBase: Intel: Eigene diskrete Grafikchips kommen, Nachricht vom 23. Januar 2007
↑ ComputerBase: IDF: Polaris 2 mit IA und Larrabee mit IA++, Nachricht vom 20. April 2007
↑ Intel Developer Zone: Intel: Xeon Phi 7200 Memory Management Optimizations, Dokumentation vom 22. Dezember 2016
↑ Andreas Stiller: Xeon Phi ist tot, es lebe der Xeon-H. In: heise online. 15. November 2017, abgerufen am 7. August 2021.

[CB_1-1] ComputerBase: Larrabee als Consumer-Grafikkarte ist Geschichte, Nachricht vom 5. Dezember 2009

[Anand-2] AnandTech: Intel Announces Xeon Phi Family of Co-Processors – MIC Goes Retail, Nachricht vom 19. Juni 2012

[3] ComputerBase: Intel: Eigene diskrete Grafikchips kommen, Nachricht vom 23. Januar 2007

[4] ComputerBase: IDF: Polaris 2 mit IA und Larrabee mit IA++, Nachricht vom 20. April 2007

[5] Intel Developer Zone: Intel: Xeon Phi 7200 Memory Management Optimizations, Dokumentation vom 22. Dezember 2016

[6] Andreas Stiller: Xeon Phi ist tot, es lebe der Xeon-H. In: heise online. 15. November 2017, abgerufen am 7. August 2021.

[1]

[2]

[3]

[4]

[5]

[6]

Navigation