Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty.
Radeon HD 3870 |
Radeon HD 4850
|
Radeon HD 4850 Toxic
|
Radeon HD 4870 |
|
Jadro: |
RV670 | RV770 | RV770 | RV770 |
Výrobný proces: |
55nm | 55nm | 55nm | 55nm |
Veľkosť jadra: |
~192 mm^2 | ~256mm^2 |
~256mm^2 | ~256mm^2 |
Počet tranzistorov: |
~666 miliónov | ~956 miliónov |
~956 miliónov |
~956 miliónov |
Frekvencia jadra: |
775 MHz | 625 MHz |
675 MHz |
750 MHz |
Frekvencia pamäte: |
1125 MHz |
999 MHz |
1150 MHz |
900 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR4 |
512MiB, GDDR3 | 512MiB, GDDR3 | 512MiB, GDDR5 |
Frekvencia shadercore: |
775 MHz |
625 MHz |
675 MHz |
750 MHz |
Počet TFUs: |
16 | 40 |
40 |
40 |
Počet TAUs: |
32 | 40 |
40 |
40 |
Počet ALUs: |
64x Vec5 (320 SPs) |
160x Vec5 (800 SPs) |
160x Vec5 (800 SPs) |
160x Vec5 (800 SPs) |
Počet ROPs |
16 | 16 |
16 |
16 |
Podpora D3D: | 10.1 | 10.1 | 10.1 | 10.1 |
Pixel fillrate: |
12 400 Mpixels/s | 10 000 Mpixels/s |
10 800 Mpixels/s |
12 000 Mpixels/s |
Bilinear texelfillrate: |
12 400 Mpixels/s | 25 000 Mtexels/s |
27 000 Mtexels/s |
30 000 Mtexels/s |
Bilinear FP-16 texel fillrate: |
12 400 Mtexels/s | 12 500 Mtexels/s |
13 500 Mtexels/s |
15 000 Mtexels/s |
Z-sample rate: |
24 800 Msamples/s | 40 000 Msamples/s |
43 200 Msamples/s |
48 000 Msamples/s |
AA-sample rate: | 49 600 Msamples/s | 80 000 Msamples/s |
86 400 Msamples/s |
96 000 Msamples/s |
Aritmetický výkon: | 496 GFlop/s | 1000 GFlop/s |
1080 GFlop/s |
1200 GFlop/s |
Geometry rate: | 775 Mtriangles/s | 625 Mtriangles/s |
675 Mtriangles/s |
750 Mtriangles/s |
Šírka zbernice: |
256 bit | 256 bit |
256 bit |
256 bit |
Priepustnosť pamäte: | 72 GB/s | 63,5 GB/s |
73,6 GB/s |
115,2 GB/s |
GeForce 8800 GTX |
GeForce 9800 GTX |
GeForce 9800 GTX+ |
GeForce GTX 260 |
|
Jadro: |
G80 | G92 | G92b | G200 |
Výrobný proces: |
90nm | 65nm | 55nm | 65nm |
Veľkosť jadra: |
~484 mm^2 | ~325 mm^2 | ~276 mm^2 | ~576 mm^2 |
Počet tranzistorov: |
~681 miliónov | ~754 miliónov | ~754 miliónov | ~1400 miliónov |
Frekvencia jadra: |
575 MHz | 675 MHz | 738 MHz | 576 MHz |
Frekvencia pamäte: |
900 MHz | 1100 MHz | 1100 MHz | 999 MHz |
Kapacita, typ pamäte: |
768MiB, GDDR3 | 512MiB, GDDR3 | 512MiB, GDDR3 | 896MiB |
Frekvencia shadercore: |
1350 MHz | 1688 MHz | 1836 MHz | 1242 MHt |
Počet TFUs: |
64 | 64 | 64 | 64 |
Počet TAUs: |
32 | 64 | 64 | 64 |
Počet ALUs: |
8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) | 8x Vec24 (192 SPs) |
Počet ROPs |
24 | 16 | 16 | 28 |
Podpora D3D: | 10 | 10 | 10 | 10 |
Pixel fillrate: |
13 800 Mpixels/s | 10 800 Mpixels/s | 11 808 Mpixels/s | 16 128 Mpixels/s |
Bilinear texelfillrate: |
18 400 Mtexels/s | 43 200 Mtexels/s | 47 232 Mtexels/s | 36 864 Mtexels/s |
Bilinear FP-16 texel fillrate: |
18 400 Mtexels/s | 21 600 Mtexels/s | 23 616 Mtexels/s | 18 432 Mtexels/s |
Z-sample rate: |
55 200 Msamples/s | 43 200 Msamples/s | 47 232 Msamples/s | 64 512 Msamples/s |
AA-sample rate: | 110 400 Msamples/s | 86 400 Msamples/s | 94 464 Msamples/s | 129 024 Msamples/s |
Aritmetický výkon: | 518,4 GFlop/s | 648,2 GFlop/s | 705 GFlop/s | 715,4 GFlop/s |
Geometry rate: | 575 Mtriangles/s | 675 Mtriangles/s | 738 Mtriangles/s | 576 Mtriangles/s |
Šírka zbernice: |
384 bit | 256 bit | 256 bit | 448 bit |
Priepustnosť pamäte: | 86,4 GB/s | 70,4 GB/s | 70,4 GB/s | 111,9 GB/s |
Keďže sme sa už venovali architektúram čipov G200 a RV770, nebudem sa tu opakovať a pripomeniem len to najpodstatnejšie. U oboch nových čipoch bola zlepšená oproti ich predchodcom efektivita. Vidieť to veľmi dobre na príklade GeForce GTX 260, ktorá síce má viaceré dôležité teoretické parametre nižšie ako napr. GeForce 9800 GTX+, napriek tomu podáva vyšší výkon, hlavne v náročnejších nastaveniach. Obdobne je to s RV770, u nej ale nie je tá efektivita tak "merateľná", pretože má vyšší počet výpočtových jednotiek a jej architektúra bola zmenená viac v porovnaní s RV670 ako sa to udialo pri G200 - G92.
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x. Texturovacie jednotky G200 sa výrazne nezmenili, pracujú však oproti tým v G8x/G8x zhruba o 22% efektívnejšie s dostupnou texelfillrate.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je v G8x/G9x často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670/RV770 je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri. Keď však porovnávame aritmetický výkon G8x/G9x s G200, musíme si uvedomiť, že novší čip sa znovu približuje viac k teoretickej hodnote, vďaka lepšiemu využitu druhej MUL subjednotky. nVidia udáva až ~93% využitie.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom RV770, G200, RV670, G80 a R600:
bart31
Vacropoli
crux2005
Gudas
M1ch4l
crux2005
juloSVKxxl
hvk
hvk
Mikhail
crux2005
Timeshifter
hmlafo
crux2005
mmichalll
SimonB