Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty. Radeon HD 4850 dosahuje napriek nižšej pracovnej frekvencii jadra vyššie viaceré teoretické hodnoty ako HD 3850/3870, nakoľko má jadro RV770 v prorovnaní s RV670 viac výpočtových jednotiek.
Radeon HD 3850 |
Radeon HD 3870 |
Radeon HD 4850
|
Radeon HD 4850 Toxic
|
|
Jadro: |
RV670 | RV670 | RV770 | RV770 |
Výrobný proces: |
55nm | 55nm | 55nm | 55nm |
Veľkosť jadra: |
~192 mm^2 | ~192 mm^2 | ~256mm^2 |
~256mm^2 |
Počet tranzistorov: |
~666 miliónov | ~666 miliónov | ~956 miliónov |
~956 miliónov |
Frekvencia jadra: |
670 MHz |
775 MHz | 625 MHz |
675 MHz |
Frekvencia pamäte: |
830 MHz | 1125 MHz |
999 MHz |
1150 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 | 512MiB, GDDR4 |
512MiB, GDDR3 | 512MiB, GDDR3 |
Frekvencia shadercore: |
670 MHz |
775 MHz |
625 MHz |
675 MHz |
Počet TFUs: |
16 | 16 | 40 |
40 |
Počet TAUs: |
32 | 32 | 40 |
40 |
Počet ALUs: |
64x Vec5 (320 SPs) |
64x Vec5 (320 SPs) |
160x Vec5 (800 SPs) |
160x Vec5 (800 SPs) |
Počet ROPs |
16 | 16 | 16 |
16 |
Podpora D3D: | 10.1 | 10.1 | 10.1 | 10.1 |
Pixel fillrate: |
10 720 Mpixels/s | 12 400 Mpixels/s | 10 000 Mpixels/s |
10 800 Mpixels/s |
Bilinear texelfillrate: |
10 720 Mtexels/s | 12 400 Mpixels/s | 25 000 Mtexels/s |
27 000 Mtexels/s |
Bilinear FP-16 texel fillrate: |
10 720 Mtexels/s | 12 400 Mtexels/s | 12 500 Mtexels/s |
13 500 Mtexels/s |
Z-sample rate: |
21 440 Msamples/s | 24 800 Msamples/s | 40 000 Msamples/s |
43 200 Msamples/s |
AA-sample rate: | 42 880 Msamples/s | 49 600 Msamples/s | 80 000 Msamples/s |
86 400 Msamples/s |
Aritmetický výkon: | 428,8 GFlop/s | 496 GFlops/ | 1000 GFlop/s |
1080 GFlop/s |
Geometry rate: | 670 Mtriangles/s | 775 Mtriangles/s | 625 Mtriangles/s |
675 Mtriangles/s |
Šírka zbernice: |
256 bit | 256 bit | 256 bit |
256 bit |
Priepustnosť pamäte: | 53,1 GB/s | 72 GB/s | 63,5 GB/s |
73,6 GB/s |
GeForce 8800 GT |
GeForce 8800 GTX |
GeForce 9800 GTX |
GeForce 9800 GTX+ |
|
Jadro: |
G92 | G80 | G92 | G92b |
Výrobný proces: |
65nm | 90nm | 65nm | 55nm |
Veľkosť jadra: |
~325 mm^2 | ~484 mm^2 | ~325 mm^2 | ~276 mm^2 |
Počet tranzistorov: |
~754 miliónov | ~681 miliónov | ~754 miliónov | ~754 miliónov |
Frekvencia jadra: |
600 MHz | 575 MHz | 675 MHz | 738 MHz |
Frekvencia pamäte: |
900 MHz | 900 MHz | 1100 MHz | 1100 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 | 768MiB, GDDR3 | 512MiB, GDDR3 | 512MiB, GDDR3 |
Frekvencia shadercore: |
1512 MHz | 1350 MHz | 1688 MHz | 1836 MHz |
Počet TFUs: |
56 | 64 | 64 | 64 |
Počet TAUs: |
56 | 32 | 64 | 64 |
Počet ALUs: |
7x Vec16 (112 SPs) | 8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) |
Počet ROPs |
16 | 24 | 16 | 16 |
Podpora D3D: | 10 | 10 | 10 | 10 |
Pixel fillrate: |
9600 Mpixels/s | 13 800 Mpixels/s | 10 800 Mpixels/s | 11 808 Mpixels/s |
Bilinear texelfillrate: |
33 600 Mtexels/s | 18 400 Mtexels/s | 43 200 Mtexels/s | 47 232 Mtexels/s |
Bilinear FP-16 texel fillrate: |
16 800 Mtexels/s | 18 400 Mtexels/s | 21 600 Mtexels/s | 23 616 Mtexels/s |
Z-sample rate: |
38 400 Msamples/s | 55 200 Msamples/s | 43 200 Msamples/s | 47 232 Msamples/s |
AA-sample rate: | 76 800 Msamples/s | 110 400 Msamples/s | 86 400 Msamples/s | 94 464 Msamples/s |
Aritmetický výkon: | 508 GFlop/s | 518,4 GFlop/s | 648,2 GFlop/s | 705 GFlop/s |
Geometry rate: | 600 Mtriangles/s | 575 Mtriangles/s | 675 | 738 |
Šírka zbernice: |
256 bit | 384 bit | 256 bit | 256 bit |
Priepustnosť pamäte: | 57,6 GB/s | 86,4 GB/s | 70,4 GB/s | 70,4 GB/s |
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670/RV770 je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom RV770, RV670, G80 a R600:
SUBOSVK
SimonB
M1ch4l
Memnon
crux2005
M1ch4l
Memnon
MichiGen
crux2005
lkuzman
crux2005
SUBOSVK