Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty:
Radeon HD 3850 512 GDDR3 |
Radeon HD 3870 512 GDDR4 |
HD 3870 512 GDDR4 @ CrossFire |
|
Jadro: |
RV670 | RV670 | 2x RV670 |
Výrobný proces: |
55nm | 55nm | 55nm |
Veľkosť jadra: |
~192 mm2 | ~192 mm2 | 2x ~192 mm2 |
Počet tranzistorov: |
~666 miliónov | ~666 miliónov | ~666 miliónov |
Frekvencia jadra: |
670 MHz |
775 MHz | 2x 775 MHz |
Frekvencia pamäte: |
830 MHz | 1125 MHz |
2x 1125 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 | 512MiB, GDDR4 |
2x 512MiB, GDDR4 |
Frekvencia shadercore: |
670 MHz |
775 MHz |
2x 775 MHz |
Počet TFUs: |
16 | 16 | 2x 16 |
Počet TAUs: |
32 | 32 | 2x 32 |
Počet ALUs: |
64x Vec5 (320 SPs) |
64x Vec5 (320 SPs) |
2x 64x Vec5 (640 SPs) |
Počet ROPs |
16 | 16 | 2x 16 |
Podpora D3D: | 10.1 | 10.1 | 10.1 |
Pixel fillrate: |
10 720 Mpixels/s | 12 400 Mpixels/s | 2x 12 400 Mpixels/s |
Bilinear texelfillrate: |
10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mpixels/s |
Bilinear FP-16 texel fillrate: |
10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mtexels/s |
Z-sample rate: |
21 440 Msamples/s | 24 800 Msamples/s | 2x 24 800 Msamples/s |
AA-sample rate: | 42 880 Msamples/s | 49 600 Msamples/s | 2x 49 600 Msamples/s |
Aritmetický výkon: | 428,8 GFlop/s | 496 GFlop/s | 2x 496 GFlop/s |
Geometry rate: | 670 Mtriangles/s | 775 Mtriangles/s | 2x 775 Mtriangles/s |
Šírka zbernice: |
256 bit | 256 bit | 2x 256 bit |
Priepustnosť pamäte: | 53,1 GB/s | 72 GB/s | 2x 72 GB/s |
GeForce 9600 GT OC |
GeForce 9600 GT
|
GeForce 8800 GT |
GeForce 8800 GTX |
|
Jadro: |
G94 | G94 | G92 | G80 |
Výrobný proces: |
65nm | 65nm | 65nm | 90nm |
Veľkosť jadra: |
~240mm2 | ~240mm2 |
~325 mm2 | ~484 mm2 |
Počet tranzistorov: |
~505 miliónov | ~505 miliónov | ~754 miliónov | ~681 miliónov |
Frekvencia jadra: |
700 MHz |
650 MHz |
600 MHz |
575 MHz |
Frekvencia pamäte: |
950 MHz |
900 MHz |
900 MHz |
900 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 |
512MiB, GDDR3 |
512MiB, GDDR3 |
768MiB, GDDR3 |
Frekvencia shadercore: |
1680 MHz |
1625 MHz | 1512 MHz |
1350 MHz |
Počet TFUs: |
32 | 32 | 56 | 64 |
Počet TAUs: |
32 | 32 | 56 | 32 |
Počet ALUs: |
4x Vec16 (64 SPs) |
4x Vec16 (64 SPs) | 7x Vec16 (112 SPs) |
8x Vec16 (128 SPs) |
Počet ROPs |
16 | 16 | 16 | 24 |
Podpora D3D: | 10 | 10 | 10 | 10 |
Pixel fillrate: |
11 200 Mpixels/s |
10 400 Mpixels/s |
9600 Mpixels/s | 13 800 Mpixels/s |
Bilinear texelfillrate: |
22 400 Mtexels/s |
20 800 Mtexels/s |
33 600 Mtexels/s |
18 400 Mtexels/s |
Bilinear FP-16 texel fillrate: |
11 200 Mtexels/s |
10 400 Mtexels/s | 16 800 Mtexels/s | 18 400 Mtexels/s |
Z-sample rate: |
44 800 Msamples/s | 41 600 Msamples/s |
38 400 Msamples/s | 55 200 Msamples/s |
AA-sample rate: | 89 600 Msamples/s |
83 200 Msamples/s | 76 800 Msamples/s | 110 400 Msamples/s |
Aritmetický výkon: | 322,56 GFlop/s |
312 GFlop/s |
508 GFlop/s | 518,4 GFlop/s |
Geometry rate: | 700 Mtriangles/s |
650 Mtriangles/s | 600 Mtriangles/s | 575 Mtriangles/s |
Šírka zbernice: |
256 bit |
256 bit | 256 bit | 384 bit |
Priepustnosť pamäte: | 60,8 GB/s |
57,6 GB/s | 57,6 GB/s | 86,4 GB/s |
Poznámky:
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670 čipe je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom G80, R600:
jutes
M1ch4l
Gudas
M1ch4l
M1ch4l
andrejsvk
JeffoneoN
fobos
Pavol Bobik
fobos
Gudas
Pavol Bobik
sapiq
crux2005