G80 bol vyrábaný 90nm výrobným procesom 90GT u TSMC. Jeho počet tranzistorov bol danú dobu naozaj ťažko uveriteľných ~ 681 miliónov. U G200 ide nVidia ďalej a vsadila na 65nm proces, ktorý bol už vyskúšaný s čipmi G92/G94. Preto mohol aj narásť počet tranzistorov, ktorý je podľa viacerých zdrojov okolo 1.4 miliardy! Podobný počet tranzistorov majú serverové procesory od Intelu. Je tu ale jeden veľký rozdiel, v prípade grafických čipov zaberajú skoro celý počet logické tranzistory na rozdiel od procesorov, kde je to pamäť cache. Náročnosť pri výrobe je teda niekde úplne inde. Oproti G92 je to skoro zdvojnásobenie. Takýto veľký počet tranzistorov investovala nVidia do výpočtových jednotiek. Podľa jednoduchej logiky by mal mať G200 zdvojnásobené všetky najpodstatnejšie výpočtové jednotky G92. 8 clusterový G92 ich mal: 64 TMUs, 128 SPs, 16 ROPs, 256bit zbernica. Čisto teoreticky samozrejme. Reálne tomu úplne tak nie je.
(jadro G200 pod mikroskopom)
G200 na GTX 280 bude obsahovať pravdepodobne 80 TMUs (textúrovacích jednotiek), nie je ešte celkom jasné, či má 80 TFUs (filtrovacích) a 80 TAUs (adresovacích), alebo má polovičný počet TAUs v cluteroch ako G80. V konečnom dôsledku je to pri reálnych hrách jedno, pretože sa minimálne trilineárne filtrovanie často využíva. Rozdiel je jedine v "číselku", ktoré stojí za čistým texelfillrate-om. Bližšie sme o venovali problematike v
diskusnom fóre a
technických detailoch grafických kariet. GTX 260 má aktívnych len 8 clusterov. Každý cluster obsahuje 8 TMUs, dokopy 64 aktívnych TMUs.
V hrách narastá potreba aritmetického výkonu oveľa rýchlejšie ako potreba texelfillrate, preto nemusela nV zvýšiť počet TMUs výrazne. Výkon shader-core by si ale zaslúžil poriadny nárast výkonu oproti G9x. Tak sa aj stalo. GTX 280 obsahuje 240 marketingovo nazvaných "stream procesorov", čo sú vlastne "skalárne" ALUs. Skalárne v uvodzovkách preto, lebo reálne sú to stále Vec jednotky. Len vďaka riadiacim jednotkám sa ale tvária ako skalárne. Shader-core GTX 280 pozostáva reálne z desiatich Vec 24 jednotiek (G80 obsahoval 8 * Vec 16 ALUs) s plnou podporou double precision - 64bit presnosť spracovania údajov. GTX 260 má aktívnych len osem Vec 24, dokopy 192 ALUs. O podpore Direct3D 10.1 možno len špekulovať. Okrem ALUs by musela nVidia upraviť aj TMUs, či tak spravila je viac ako otázne. Aritmetický výkon by sa teda aspoň podľa počtu jednotiek ani nezdvojnásobil. Skutočnosť je ale iná. Prečo to je tak, nám ukáže až ďalšie vylepšenie G200 oproti G80/G92. Každá ALU alebo SP, dokázala od G8x cez G9x - 3 floating point operácie za takt = MAD +
MUL.
3 FLOPs/s * počet ALUs * ich pracovná frekvencia = aritmetický výkon.
Reálne v hrách sa dali na general shading využiť ALUs G8x/G9x ale len na 2 floating point operácie za takt - teda len MAD. Dôvod je ten, že druhá
MUL (MAD pozostáva z ADD + MUL) bola využívaná na korekcie perspektív, interpoláciu. Len vo veľmi MUL intenzívnych testoch ju bolo možné od ovládača ForceWare 158.19 využiť na 15% aj na general shading. V hrách je toto vyťaženie samozrejme menšie. Reálne majú preto všetky GeForce 8/9 grafické karty založené na G8x/G9x aritmetický výkon o 1/3 menší ako je udávané na "papieri". V prípade G200 to ale neplatí. nVidia "našla" missing MUL, vďaka tomu, že ju odbremenila a pridala ďalšie sub-jedotky do shader-core, ktoré sa teraz starajú o tieto vyššie zmienené operácie.
Keď si teraz porovnáme aritmetický výkon nám vychádza, že GTX 280 ho má zhruba trojnásobný oproti 8800 GTX (933 GFLOP/s vs. 345 GFLOP/s). Dostali sme sa k hodnote aritmetického výkonu G200, ktorá je zhruba 933 GFLOP/s. O pár GFLOP/s pod magickou a psychicky dosť podstatnou hranicou 1 TFLOP/s.
Dôvod prečo sa tak nVidia rozhodla možno len dedukovať. Pracovné frekvencie sa určujú až relatívne na konci vývojového štádia a závisia od veľkého množstva faktorov. G200 si zachovala schopnosť, že jej shader-core pracuje na vyššej frekvencii ako zvyšok čipu. Toto je možné len vďaka ručne optimalizovaným custom tranzistorom. Vráťme sa ale k frekvencii, ALUs G200 budú pracovať s frekvenciou okolo 1297 MHz a na docielenie 1 TFLOP/s by bola minimálne nutná frekvencia 1389 MHz. S vyššou frekvenciou sa ale zvyšuje stratové teplo produkované čipom, jeho vyťaženosť pri výrobnom procese atď. Okrem jedného pozitíva - mierne vyššieho aritmetického výkonu to má viaceré negatíva. nVidia sa preto asi rozhodla proti.
Na "konci" render pipeline sú ROPs, na ktoré sa teraz pozrieme. G200 so všetkými výpočtovými jednotkami ich má mať 32. Osekaná verzia 28. Oproti G80 sa dočkali viacerých vylepšení, ktoré aspoň z časti poznáme. ROPs G200 obsahujú rovnaké vylepšenie oproti G80 týkajúce sa lepšej kompresie Z/stencil a inteligentnejšieho z-cullingu ako má G92. Zvýšené boli aj schopnosti blender jednotiek v ROPs, ktoré sú oproti G80 až 3x výkonnejšie. Nakoľko má mať G200 stále crossbar a šírka zbernice závisí priamo úmerne od počtu ROPs, vyplýva nám, že GTX 280 bude mať 512bit zbernicu. Osekaná verzia GTX 260 bude mať preto len 448bit zbernicu (16*28). Predpokladá sa znovu rozdelenie kanálov na 64bitové, lebo sú 32bit príliš drahé na počet tranzistorov. Z toho nám vyplýva 16 pamäťových čipov na PCB (512/32 = 16). 8 na prednej strane a 8 na zadnej. Celková kapacita VRAM GeForce GTX 280 má byť 1GiB, ako sa pre high-end kartu patrí. GTX 260 sa bude musieť uspokojiť so 896MiB VRAM. G200 potrebuje podľa testov okolo 140 GB/s priepustnosť. Priepustnosť sa dá dosiahnuť viacerými spôsobmi. Vďaka zbernici a frekvencii pamäte. nVidia sa kvôli otáznej dostupnosti GDDR 5 pamätí, rozhodla pre 0,83ns GDDR 3 pamäte. Nutná bola preto 512bit zbernica. Grafická karta GeForce GTX 280 bude mať preto k dispozícii ~ 140 GB/s priepustnosť.
Pri pohľade na čisto papierové technické parametre, nie je G200 dvojnásobný G80/G92. Vďaka viacerým vylepšeniam, ale bude dosahovať aj trojnásobný výkon oproti G80 a ešte väčší oproti G92, keď menovanej budú limitovať ROPs a veľkosť VRAM. Medzi takéto vylepšenia, ktoré som ešte nespomenul patria: väčšie cache pamäte, ktoré by v spojení s veľkou priepustnosťou mali zaručiť oveľa nižší prepad výkonu s 8xMSAA ako to bolo na G80. Zlepšený triangle setup, na "začiatku" čipu. Vďaka nemu by sa mal zvýšiť geometry a vertex shader výkon, ale aj iné, súvisiace veci - ako už vyššie zmienený 8xMSAA.
(výkonnostné údaje nových G200 grafických kariet oproti Radeon HD 3870X2, nenechajte sa oklamať veľkosťou stĺpca, ktorá je zavádzajúca, podstatný je nárast výkonu uvedený vľavo)
Keďže má G200 takéto veľké množstvo jednotiek a shader-core bežiaci na vyššej frekvencii, nemusela sa oproti G80 veľmi zvyšovať frekvencia. V porovnaní s G92 je dokonca znížená na 602 MHz v prípade GTX280 a 576 MHz na GTX 260. Napriek tomu je TDP veľmi vysoké, až 236W u GTX 260 a 182W u GTX 260. Reálne očakávam nižšiu spotrebu, pohybujúcu sa na GTX 280 ~ 180W v záťaži a ~ 130W s GTX 260. Samozrejmosťou sa tak stáva dvojslotový chladič, ktorý je svojim výzorom veľmi podobný tomu na GeForce 8800 GTX . Oproti predchádzajúcim grafickým kartám je to značný nárast v spotreba, kto chce ale maximálny výkon, musí túto skutočnosť akceptovať. Dvoj až trojnásobný G80 výkon za ~ 50% vyššiu spotrebu. Tomu hovorím veľmi dobrý pomer výkon/W. Som zvedavý, či sa konkurencii podarí priblížiť, alebo nie.
Vysoký výkon, veľký čip, vysoké teoretické parametre, viaceré interné vylepšenia v čipe, veľká VRAM a mierne vyššia spotreba. High-end ako sa patrí ? Podľa mňa určite áno, v zmysle výkonného single-čipového riešenia, ktoré je zatiaľ stále lepšie ako dvojčipové karty typu GeForce 9800 GX2, Radeon HD 3870 X2 a iné. Pre množstvo nedostatkov a v neposlednom rade aj pre ovládače, nevidím tieto karty ako alternatívu. 17. júna 2008 padnú tieto karty rýchlo do zabudnutia, lebo ich vystrieda na výkonnostnej špici nová generácia, aspoň u nVidie, ktorá ponúka vo všetkých smeroch "viac". Vysoká bude logicky aj cena. nVidia udáva ako odporúčanú cenu pre GeForce GTX 280 $650 a pre GTX 260 $449. V Európe sa tieto ceny pravdepodobne prerátajú 1:1 na Euro. Ak k tomu pridáme v prvých dňoch nižší počet dostupných kariet, sa môže cena GeForce GTX 280 vyšplhať aj na 24 000 SK. GTX 260 bude mať už od začiatku oveľa prijateľnejšiu cena a ďalšia výhoda je, že nie je v pomere tak veľmi osekaná ako bola svojho času GeForce 8800 GTS oproti GTX.
(vybrala nVidia správny termín vydania ? o tom by sa dalo určite polemizovať ;-) ...)
Zdroje: rôznePríbuzné články:
Odporúčame:
doomed
Tomus
Bmw_case
Bmw_case
Tom2871989
doomed
tom247
Sapphire
dexter
NaP0LeOn
Gudas
dexter
NaP0LeOn
crux2005
lavak
skipi
baqq
FragStop2