Technické údaje grafických kariet
Na nasledujúcej stránke sú porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické maximálne hodnoty.
Radeon HD 4870 | Radeon HD 4890 | Radeon HD 5850 | Radeon HD 5870 | |
Jadro: | RV770 | RV790 | "Cypress" RV870 | "Cypress" RV870 |
Výrobný proces: | 55nm | 55nm | 40nm | 40nm |
Veľkosť jadra: | ~256 mm^2 | ~282 mm^2 | ~334 mm^2 | ~334 mm^2 |
Počet tranzistorov: | ~956 miliónov | ~959 miliónov | ~2154 miliónov | ~2154 miliónov |
Počet aktívnych clustrov: | 10 | 10 | 18 | 20 |
Frekvencia jadra: | 750 MHz | 850 MHz | 725 MHz | 850 MHz |
Frekvencia pamäte: | 900 MHz | 975 MHz | 1000 MHz | 1200 MHz |
Kapacita, typ pamäte: | 512 MiB/ 1GiB, GDDR5 | 1 GiB, GDDR5 | 1 GiB, GDDR5 | 1 GiB, GDDR5 |
Frekvencia shadercore: | 750 MHz | 850 MHz | 725 MHz | 850 MHz |
Počet TFUs: | 40 | 40 | 72 | 80 |
Počet TAUs: | 40 | 40 | 72 | 80 |
Počet ALUs: | 160x Vec5 (800 SPs) | 160x Vec5 (800 SPs) | 288x Vec5 (1440 SPs) | 320x Vec5 (1600 SPs) |
Počet ROPs | 16 | 16 | 32 | 32 |
Podpora Direct3D: | 10.1 | 10.1 | 11 | 11 |
Pixel fillrate: | 12 000 MPixels/s | 13 600 MPixels/s | 23 200 MPixels/s | 27 200 MPixels/s |
Bilinear texelfillrate: | 30 000 MTexels/s | 34 000 MTexels/s | 52 200 MTexels/s | 68 000 MTexels/s |
Bilinear FP-16 texel fillrate: | 15 000 MTexels/s | 17 000 MTexels/s | 26 100 MTexels/s | 34 000 MTexels/s |
Z-sample rate: | 48 000 MSamples/s | 54 400 MSamples/s | 92 800 MSamples/s | 108 800 MSamples/s |
AA-sample rate: | 96 000 MSamples/s | 108 800 MSamples/s | 185 600 MSamples/s | 217 600 MSamples/s |
Single precision aritmetický výkon: | 1200 GFLOP/s | 1360 GFLOP/s | 2088 GFLOP/s | 2720 GFLOP/s |
Double precision aritmetický výkon: | 240 GFLOP/s | 272 GFLOP/s | 417,6 GFLOP/s | 544 GFLOP/s |
Geometry rate: | 750 MTriangles/s | 850 MTriangles/s | 725 MTriangles/s | 850 MTriangles/s |
Šírka zbernice: | 256 bit | 256 bit | 256 bit | 256 bit |
Priepustnosť pamäte: | 115,2 GB/s | 124,8 GB/s | 128 GB/s | 153,6 GB/s |
GeForce GTX 280 | GeForce GTX 285 | GeForce GTX 470 | GeForce GTX 480 | |
Jadro: | G200-300 | G200-350 | GF100-275 | GF100-375 |
Výrobný proces: | 65nm | 55nm | 40nm | 40nm |
Veľkosť jadra: | ~576 mm^2 | ~480 mm^2 | ~550 mm^2 | ~550 mm^2 |
Počet tranzistorov: | ~1400 miliónov | ~1400 miliónov | ~3000 miliónov | ~3000 miliónov |
Počet aktívnych clustrov: | 10 | 10 | 14 | 15 |
Frekvencia jadra: | 602 MHz | 648 MHz | 608 MHz | 700 MHz |
Frekvencia pamäte: | 1107 MHz | 1242 MHz | 837 MHz | 924 MHz |
Kapacita, typ pamäte: | 1 GiB, GDDR3 | 1 GiB, GDDR3 | 1280 MiB, GDDR5 | 1536 MiB, GDDR5 |
Frekvencia shadercore: | 1296 MHz | 1476 MHz | 1215 MHz | 1401 MHz |
Počet TFUs: | 80 | 80 | 56 | 60 |
Počet TAUs: | 80 | 80 | 56 | 60 |
Počet ALUs: | 10x Vec24 (240 SPs) | 10x Vec24 (240 SPs) | 14x Vec32 (448 SPs) | 15x Vec32 (480 SPs) |
Počet ROPs | 32 | 32 | 40 | 48 |
Podpora Direct3D: | 10 | 10 | 11 | 11 |
Pixel fillrate: | 19 264 MPixels/s | 20 736 MPixels/s | 24 320 MPixels/s | 33 600 MPixels/s |
Bilinear texelfillrate: | 48 160 MTexels/s | 51 840 MTexels/s | 34 048 MTexels/s | 42 000 MTexels/s |
Bilinear FP-16 texel fillrate: | 24 080 MTexels/s | 25 920 MTexels/s | 17 024 MTexels/s | 21 000 MTexels/s |
Z-sample rate: | 77 056 MSamples/s | 82 944 MSamples/s | 97 280 MSamples/s | 134 400 MSamples/s |
AA-sample rate: | 154 112 MSamples/s | 165 888 MSamples/s | 194 560 MSamples/s | 268 800 MSamples/s |
Single precision aritmetický výkon: | 933,1 GFLOP/s * 622,08 GFLOP/s (bez 2. MUL) | 1062,72 GFLOP/s * 708,45 GFLOP/s (bez 2. MUL) | 1088,6 GFLOP/s | 1344,96 GFLOP/s |
Double precision aritmetický výkon: | 77,76 GFLOP/s | 88,56 GFLOP/s | 136,08 GFLOP/s | 168,12 GFLOP/s |
Geometry rate: | 602 MTriangles/s pri 1 Tri/takt 301 MTriangles pri 0,5 Tri/takt | 648 MTriangles/s pri 1 Tri/takt 324 MTriangles/s pri 0,5 Tri/takt | 2432 MTriangles/s | 2800 MTriangles/s |
Šírka zbernice: | 512 bit | 512 bit | 320 bit | 384 bit |
Priepustnosť pamäte: | 141,7 GB/s | 158,9 GB/s | 133,92 GB/s | 177,4 GB/s |
jadro RV870 na Asus Radeon HD 5850, klikni pre zväčšenie
S novou generáciou Direct3D 11 grafických kariet platí ešte viac ako v minulosti, že výkon grafických kariet sa nedá odhadnúť čisto podľa teoretických hodnôt a taktiež sa nedajú porovnávať karty rôznych generácií, výrobcov (AMD/ATi s nVidia) medzi sebou len podľa technických parametrov. U nVidie a ich Fermi "GF100" GPUs je to spôsobené novou architektúrou, ktorá priniesla mnohé zmeny oproti predchádzajúcim Direct3D 10 GPUs. Direct3D 11 GPU RV870 alias "Cypress" od AMD/ATi síce vychádza z RV770, má oproti nemu zdvojené všetky podstatné výpočtové jednotky (TMUs, ALUs, ROPs) a pri naďalej zjednodušenom pohľade je najväčšou zmenou pridaná podpora Direct3D 11. Dalo by sa teda predpokladať, že Radeon HD 5870 bude 2x výkonnejšia ako HD 4890 a pod. Čip ale má určité nedostatky, ktoré sa dajú zhrnúť pod problém - nedostatočné vyťaženie výpočtových jednotiek a aj preto je výkonnostný rozdiel voči predchodcom menší. To v konečnom dôsledku ukážeme v dnešnej recenzii. Na tomto mieste sa ešte vyjadrím k určitým detailom GF100 na ktoré nemožno zabudnúť pri pohľade na technické detaily. Jednak je to množstvo trojuholníkov, ktoré vie čip "vypľuť" za takt. U G80-G200 čipov uvádzala nVidia 1 trojuholník za takt. Ako som však už viackrát spomínal v článkov, jedná sa o teoretické maximum, ktoré sa nedá v hrách dosiahnuť. Reálna hodnota je 0,5 trojuholníkov za takt. Túto hodnotu použila nVidia aj v slajdoch GF100, kde sa uvádza vyše 8x vyšší geometry rate. Definitívneho objasnenia sa dočkala aj "2. MUL", ktorú mali ALUs od G80 po G200B. Podľa posledných štúdií sa dala využiť aj v G200 v MUL náročných výpočtoch len z maximálne 50% (nVidia uvádzala vyše 90%). Vo väčšine hier sa však nevyužívala pre general shading, nakoľko bola zamestnaná inými výpočtami. V GF100 odpadla definitívne z ALU a pre výpočty o ktoré sa starala v G80 - G200 2. MUL, sa starajú teraz samostatné "špeciálne" jednotky. Čisto pri pohľade na počet ALUs alebo ako ich nVidia radšej značí "CUDA cores" sa ich počet v GF100 voči predchodcovi G200 zdvojnásobil. Teoretický aritmetický výkon sa ale kvôli 2. MUL, ktorá odpadla nezdvojnásobil. V skutočnosti a v hrách je ale aritmetický výkon viac ako dvojnásobný, a preto uvádzam v tabuľke s G200(B) čipmi aritmetický výkon s 2. MUL a bez nej. Posledná zaujímavosť súvisí s pixelfillrates. Tie nezávisia ako v predchádzajúcich čipoch len od počtu ROPs, ich priepustnosti a frekvencii ale priamo od počtu GPCs (clustrov) v GF100. Komplexne sa budem venovať architektúram RV870, GF100, ich kvalite anizotropného filtra (viacej scén, videá), anti-aliasingu v nasledujúcom samostatnom článku.
Pre viac informácií ohľade ostatných architektúr GPUs odporúčam prečítať technické časti článkov zaoberajúcich sa čipmi G200B, RV790, RV770, G200, RV670, G92, G80 a R600:
- Recenzia: Pretaktovaná Gigabyte GeForce GTX 285 s 2GiB
- Recenzia: Radeon HD 4890 (CrossFire) vs. GeForce GTX 275 (SLI)
- Boj o mainstream: Radeon HD 4850 (Toxic) vs. GeForce 9800 GTX (+)
- Súboj performance riešení: Radeon HD 4870 vs. GeForce GTX 260
- AMD/ATi Radeon HD 3870 (CrossFire)
- Prvé pohľady na architektúru G80
- R600 pod drobnohľadom
AmOK
1adad1
numlockn
crux2005
yesper
yesper
tutukan1
16cmfan
exot87
icefire
like
exot87
like
technar
Frosty
marcell
crux2005
exot87
Frosty
exot87
Frosty