Nvidia-GeForce-20-Serie

Logo der Nvidia-GeForce-20-Serie
ASUS GeForce RTX 2070 ROG STRIX Advanced - 8GB GDDR6

Die GeForce-20-Serie ist eine Serie von Grafikchips des Unternehmens Nvidia und Nachfolger der GeForce-10-Serie. Die GeForce-20-Serie wurde im September 2020 von der GeForce-30-Serie abgelöst.

Im Vorfeld der Gamescom stellte Nvidia die GeForce-20-Serie am 20. August 2018 vor. Die unter dem Codenamen „Turing“ (nach dem britischen Mathematiker Alan Turing) laufende Serie legte erstmals den Schwerpunkt auf Raytracing. Um diesen Aspekt zu unterstreichen, änderte Nvidia das bisher in Verkaufsnamen meist verwendete Präfix GTX in RTX um. Eine weitere Neuerung besteht in der Verwendung von GDDR6-Speicher. Verkaufsstart war der 20. September 2018.

Turing-Architektur

Die Turing-Architektur ist die direkte Weiterentwicklung der Volta-Architektur, welche aber nie bei den Grafikkarten der GeForce-Serie zum Einsatz kam. Die Volta-Architektur kam nur bei der Titan-Serie, sowie bei den professionellen Serien, Quadro und Tesla, zum Einsatz. Bei den GeForce-Grafikkarten löst die Turing-Architektur die Pascal-Architektur der GeForce-10-Serie ab.

Die Grafikprozessoren, welche auf der Turing-Architektur basieren, setzen sich aus sogenannten Graphics-Processing-Cluster (GPC) zusammen, welche teilweise auch als Raster-Engines bezeichnet werden. Jeder Graphics-Processing-Cluster enthält je 4 oder 6 Texture-Processing-Cluster (TPC), die teilweise nicht komplett aktiviert sind. Ein Texture-Processing-Cluster besteht dabei aus zwei Shader-Clustern, welche von Nvidia als Streaming-Multiprozessoren (SM) bezeichnet werden. Diese Streaming-Multiprozessoren, der Funktionsblock, der die wichtigsten Einheiten umfasst, weisen gegenüber der Pascal-Architektur erhebliche Veränderungen auf und sind teilweise neu geordnet worden.[1] Dabei sind jedem Streaming-Multiprozessor zugeordnet:

  • 64 FP32-Einheiten für 32-bit-Gleitkomma-Zahlen und 2 FP64-Einheiten für 64-bit-Gleitkomma-Zahlen
  • 64 INT32-Einheiten für 32-bit-Ganzzahlen, die parallel zu den Gleitkommaeinheiten arbeiten können
  • 4 Textureinheiten, bestehend aus je einer Texture Mapping Unit und einer Texture Address Unit
  • 16 Load/Store-Einheiten
  • 16 Special-Function-Units
  • 8 Tensoreinheiten
  • 1 Raytracing-Einheit

Bei Pascal bestand ein Streaming-Multiprozessor noch aus 128 FP32-Einheit welche entweder 32-bit-Gleitkomma-Zahlen (Floating Point) oder 32-bit-Ganzzahlen (Integer) ausgeben können. Bei Turing wurde dieses System aufgegeben und stattdessen die FP32-Einheit auf 64 reduziert, sowie neu 64 INT32-Einheiten hinzugefügt. Dadurch können beide Operationen parallel ausgeführt werden.[1] Alternativ können die FP32-Einheiten auch 16-bit-Gleitkomma-Zahlen (halbe Genauigkeit) im Verhältnis 2:1 berechnen (Pascal 1:1).[1]

Von der Volta-Architektur übernommen wurden die Tensor-Kerne für KI-Berechnungen. Dabei handelt es sich laut Nvidia um FP16-Einheiten für Matrizen-Berechnungen. Sie können aber auch FP32-, INT4- und INT8-Befehle ausführen, was aber nur bei professionellen Anwendungen von Bedeutung ist. Bei 3D-Anwendungen sind laut Nvidia nur die FP16-Berechnungen der Tensorkerne von Bedeutung.[1]

Die von Nvidias Marketing am stärksten hervorgehobene Neuerung der Turing-Architektur ist die hardwareseitige Raytracing-Unterstützung. Dazu verfügt jeder Streaming-Multiprozessor über eine Raytracing-Einheit, teilweise auch als RT Core bezeichnet. Da Nvidia keine Angaben macht, wie diese funktionieren, lässt sich derzeit auch nicht rekonstruieren, was eine RT-Einheit genau tut. Nvidia gibt lediglich die Anzahl an RT-Einheiten pro Modell, sowie eine Füllrate von Gigarays pro Sekunde an.

Datenübersicht

Grafikprozessoren

Grafik-
chip
FertigungEinheitenL2-
Cache
API-SupportVideo-
pro-
zessor
Bus-
Schnitt-
stelle
NV-
Link
Pro-
zess
Transis-
toren
Die-
Fläche
ROPsUnified-ShaderTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
DirectXOpenGLOpenCLCUDAVulkan
GPCSMALUs
TU10212 nm18,6 Mrd.754 mm²966724608288576726 MB12.14.61.27.11.1.78k. A.PCIe 3.0
TU10413,6 Mrd.545 mm²646483072192384484 MB
TU10610,6 Mrd.445 mm²643362304144288364 MB

Desktop-Modelldaten

ModellOffizieller
Launch
Grafikprozessor (GPU)GrafikspeicherLeistungsdaten[Anm. 1]Leistungsaufnahme
TypAktive EinheitenChiptakt
[Anm. 2]
Speicher-
größe
Speicher-
takt[Anm. 2]
Speicher-
interface
Rechenleistung
(in TFlops)
FüllrateSpeicher-
bandbreite

(in GB/s)
MGCP
[Anm. 3]
Messwerte
[Anm. 4]
ROPsSMALUsTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
BasisBoostALUs
(16 / 32 / 64 bit)
Tensor-Kerne
(4 / 8 / 16 bit)
Pixel
(GP/s)
Texel
(GT/s)
Rays
(GR/s)
Idle3D-
Last
GeForce RTX 2060[2]7. Jan. 2019TU106-200-A148301920120240301365 MHz1680 MHz06 GB GDDR67001 MHz192 Bit12,90 / 06,45 / 0,202206 / 103 / 52080,6201,60≈5336160 Wk. A.k. A.
GeForce RTX 2060 Super[3]9. Jul. 2019TU106-410-A164342176136272341470 MHz1650 MHz08 GB GDDR67001 MHz256 Bit14,36 / 07,18 / 0,224230 / 115 / 570105,6224,40≈6448175 W
GeForce RTX 2070[4]17. Okt. 2018TU106-400-A1
TU106-400A-A1
64362304144288361410 MHz1620 MHz7001 MHz14,93 / 07,46 / 0,233239 / 119 / 600103,7233,30≈6175 W
185 W
GeForce RTX 2070 Super[5]9. Jul. 2019TU104-410-A164402560160320401605 MHz1770 MHz7001 MHz18,12 / 09,06 / 0,283290 / 145 / 720113,3283,20≈7215 W
GeForce RTX 2080[6]20. Sep. 2018TU104-400-A1
TU104-400A-A1
64462944184368461515 MHz1710 MHz7001 MHz20,14 / 10,07 / 0,315322 / 161 / 810109,4314,60≈8215 W
225 W
GeForce RTX 2080 Super[7]23. Jul. 2019TU104-450-A164483072192384481650 MHz1815 MHz7751 MHz22,30 / 11,15 / 0,348357 / 180 / 890116,2348,50≈8496250 W
GeForce RTX 2080 Ti[8]27. Sep. 2018TU102-300-K1-A1
TU102-300A-K1-A1
88684352272544681350 MHz1545 MHz11 GB GDDR67001 MHz352 Bit26,90 / 13,45 / 0,420430 / 215 / 108136420,2≈10616250 W
260 W
Nvidia Titan RTX[9]18. Dez. 2018TU102-400-A196724608288576721350 MHz1770 MHz24 GB GDDR67001 MHz384 Bit32,63 / 16,31 / 0,510522 / 261 / 131129,6388,8≈11672280 W

Notebook-Modelldaten

ModellOffizieller
Launch
Grafikprozessor (GPU)GrafikspeicherLeistungsdaten[Anm. 1]MGCP
[Anm. 3]
TypAktive EinheitenChiptakt
[Anm. 2]
Speicher-
größe
Speicher-
takt[Anm. 2]
Speicher-
interface
Rechenleistung
(in TFlops)
FüllrateSpeicher-
bandbreite

(in GB/s)
ROPsSMALUsTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
BasisBoost32 bit64 bitPixel
(GP/s)
Texel
(GT/s)
Rays
(GR/s)
GeForce RTX 2060 Max-Q29. Jan. 2019TU1064830192012024030975 MHz1185 MHz6 GB GDDR65500 MHz192 Bit4,550,1456,9142,2k. A.26465 W
GeForce RTX 2060 Mobile29. Jan. 2019TU1064830192012024030960 MHz1200 MHz5500 MHz4,60,1457,6144k. A.26465 W
GeForce RTX 2060 Super Mobile10. Apr. 2020TU10664342176136272341305 MHz1485 MHz8 GB GDDR67001 MHz256 Bit6,460,295202k. A.448100 W
GeForce RTX 2070 Max-Q29. Jan. 2019TU1066436230414428836885 MHz1185 MHz7001 MHz5,460,1775,8170,6k. A.44890 W
GeForce RTX 2070 Mobile29. Jan. 2019TU10664362304144288361215 MHz1440 MHz7001 MHz6,640,2192,2207,4k. A.448115 W
GeForce RTX 2070 Super Max-Q2. Apr. 2020TU1046440256016032040930 MHz1155 MHz5500 MHz5,910,1873,9184,8k. A.35280 W
GeForce RTX 2070 Super Mobile2. Apr. 2020TU10464402560160320401140 MHz1380 MHz7001 MHz7,070,2288,3220,8k. A.448115 W
GeForce RTX 2080 Max-Q29. Jan. 2019TU1046446294418436846735 MHz1095 MHz6000 MHz6,450,270,1201,5k. A.38490 W
GeForce RTX 2080 Mobile29. Jan. 2019TU10464462944184368461380 MHz1590 MHz6000 MHz9,360,29101,8292,6k. A.384150 W
GeForce RTX 2080 Super Max-Q2. Apr. 2020TU1046448307219238448735 MHz975 MHz5500 MHz5,990,1962,4187,2k. A.35280 W
GeForce RTX 2080 Super Mobile2. Apr. 2020TU10464483072192384481365 MHz1560 MHz7001 MHz9,590,399,8299,5k. A.448150 W

Anmerkungen

  1. a b Die angegebenen Leistungswerte für die Rechenleistung über die Streamprozessoren, die Pixel- und Texelfüllrate, sowie die Speicherbandbreite sind theoretische Maximalwerte (bei Boosttakt), die nicht direkt mit den Leistungswerten anderer Architekturen vergleichbar sind. Die Gesamtleistung einer Grafikkarte hängt unter anderem davon ab, wie gut die vorhandenen Ressourcen ausgenutzt bzw. ausgelastet werden können. Außerdem gibt es noch andere, hier nicht aufgeführte Faktoren, die die Leistungsfähigkeit beeinflussen.
  2. a b c d Bei den angegeben Taktraten handelt es sich um die von Nvidia empfohlenen bzw. festgelegten Referenzdaten, beim Speichertakt wird der effektive Takt angegeben. Allerdings kann der genaue Takt durch verschiedene Taktgeber um einige Megahertz abweichen, des Weiteren liegt die finale Festlegung der Taktraten in den Händen der jeweiligen Grafikkarten-Hersteller. Daher ist es durchaus möglich, dass es Grafikkarten-Modelle gibt oder geben wird, die abweichende Taktraten besitzen.
  3. a b Der von Nvidia angegebene MGCP-Wert entspricht nicht zwingend der maximalen Leistungsaufnahme. Dieser Wert ist auch nicht unbedingt mit dem TDP-Wert des Konkurrenten AMD vergleichbar.
  4. Die in der Tabelle aufgeführten Messwerte beziehen sich auf die reine Leistungsaufnahme von Grafikkarten, die dem Nvidia-Referenzdesign entsprechen. Um diese Werte zu messen, bedarf es einer speziellen Messvorrichtung; je nach eingesetzter Messtechnik und gegebenen Messbedingungen, inklusive des genutzten Programms, mit dem die 3D-Last erzeugt wird, können die Werte zwischen unterschiedlichen Apparaturen schwanken. Daher sind hier Messwertbereiche angegeben, die jeweils die niedrigsten, typischen und höchsten gemessenen Werte aus verschiedenen Quellen darstellen.

Weblinks

Commons: Nvidia-GeForce-20-Serie – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

  1. a b c d Turing TU102, -104, -106: Die Technik der Nvidia GeForce RTX 2080 Ti, 2080 & 2070 (Seite 2). Computerbase, 14. September 2018, abgerufen am 4. Juli 2019.
  2. NVIDIA GeForce RTX 2060. Nvidia Corporation, 7. Januar 2019, abgerufen am 7. Januar 2019.
  3. NVIDIA GeForce RTX 2060 Super. Nvidia Corporation, 2. Juli 2019, abgerufen am 3. Juli 2019.
  4. NVIDIA GeForce RTX 2070. Nvidia Corporation, 20. August 2018, abgerufen am 28. September 2018.
  5. NVIDIA GeForce RTX 2070 Super. Nvidia Corporation, 2. Juli 2019, abgerufen am 3. Juli 2019.
  6. NVIDIA GeForce RTX 2080. Nvidia Corporation, 20. August 2018, abgerufen am 28. September 2018.
  7. NVIDIA GeForce RTX 2080 Super. Nvidia Corporation, 2. Juli 2019, abgerufen am 3. Juli 2019.
  8. NVIDIA GeForce RTX 2080 Ti. Nvidia Corporation, 20. August 2018, abgerufen am 28. September 2018.
  9. NVIDIA TITAN RTX jetzt verfügbar. Abgerufen am 9. Mai 2020 (deutsch).

Auf dieser Seite verwendete Medien

ASUS GeForce RTX 2070 ROG STRIX Advanced - 8GB GDDR6 1632.jpg
(c) Michael Wolf, Penig, CC BY-SA 3.0
ASUS GeForce RTX 2070 ROG STRIX Advanced - 8GB GDDR6
GeForce RTX 20 Series logo with slogan.png
The RTX 20 series logo with its slogan.