Nielen AMD/ATi mala problémy, ale aj nVidia. Zatiaľ čo sa im v high-end vďaka G80 a v danej dobe novým 65nm G92 darilo, nemali v mainstreame dlho žiadnu poriadnu kartu. Táto situácia sa ťahala od uvedenia G84, ktoré pre 80nm proces neobsahovali polovicu výpočtových jednotiek G80 ako to bývalo zvykom pre dobrý mainstream čip. Keby ich obsahovali, boli by príliš drahé na výrobu a nVidia si len nerada siaha na zisk, pokiaľ samozrejme nemusí. Celá situácia sa zmenila, keď AMD/ATi uviedla 55nm RV670 a veľmi dobrú mainstream kartu – Radeon HD 3850. nVidia musela zareagovať GeForce 9600GT – čipom G94, ktorý má poskytnúť za danú cenu vysoký výkon. Predpoklady na to má ...
Preskočme teraz na koniec roka 2007. AMD/ATi sa podarilo skôr ako bolo plánované vydať grafické karty HD 3000 série založené na RV670. Bližšie sme sa im venovali v recenzii: AMD/ATi Radeon HD 3870 (CrossFire). nVidia bola preto nútená urýchlene vydať GeForce 8800 GT, ktorá predstavuje kvôli cene a výkonu konkurenciu len pre výkonnejší model – HD 3870. Radeon HD 3850 bola dlho bez náprotivku. Zmeny sa museli dotknúť aj výkonu – pôvodný čip G92 so 6 aktívnymi clustermi (nazývané interne TPCs, thread processing clusters, nakoľko spracuvávajú „threads“), dostal ešte jeden, aby sa výkonom dostal nad úroveň RV670. Dôvod bol zlý odhad RV670 zo strany nVidie. Predpokladali, že RV670 bude obsahovať tri R600 clustre. Ako keby nemali dosť problémov, G92 vyrábaný v 65nm procese u TSMC nedosahoval očakávané frekvencie.
Dajme špekulácie bokom, fakt je, že tesne pred vydaním HD 3000 série sa nVidii podarilo „vyhodiť“ na trh GeForce 8800 GT. Vyhodiť som použil zámerne, nakoľko by vám zhovorčivejší zamestnanec nVidie povedal, „G92 a jej výrobný proces mali ešte zrieť“. Vedenie ale nechcelo nechať nové karty od AMD/ATi bez konkurencie a tak sa dostalo všetko do pohybu. Mierne by som ešte odbočil a skonštatoval, že už v tejto dobe vedela nVidia o tom, že sa AMD/ATi znovu podarí dostať na nohy a získať podiely na desktop trhu. Boli vydané aj rôzne interné dokumenty ... to sa hodí ale už viac do histórie iného čipu. :-)
najväčší konkurent a dôvod vzniku GeForce 9600 GT - AMD/ATi Radeon HD 3850
Keďže vydala nVidia v decembri ešte grafickú kartu založenú na G92 so všetkými aktívnymi clustermi, ktorých je 8: GeForce 8800 GTS-512, dalo sa očakávať, že novom roku budú nasledovať ďalšie takéto karty, ktoré vymenia starí high-end GeForce 8800 GTX/Ultra. Hlavný cieľ nVidie bolo vymeniť drahé G80 lacnejšími G92. Napriek rovnakému počtu clusterov a vyšším frekvenciám nemohla byť G92 tá „pravá“ náhrada za G80, keďže má len 16 vylepšených ROPs – z čoho vyplýva 256bit zbernica a 512MiB VRAM. Vďaka relatívne malej veľkosti 330mm^2 sa ale jadro G92 hodilo pre použitie na GX2 karte, ktorá bola naplánovaná ako konkurent pre HD 3870X2.
Boj o zákazníka, ktorý začala AMD/ATi sa tak pretavil vo viaceré pozitíva. Bola vydaná Radeon HD 3850, ktorá sa líši oproti HD 3870 len frekvenciou a ponúka za danú cenu výborný výkon, dostačujúci na väčšinu Direct3D 10 titulov. Vo viacerých prípadoch je možné zapnúť vyhladzovanie hrán a anizotropný filter. Reakcia nVidie nemala nechať dlho na seba čakať. Nakoniec sa tak stalo až o 3 mesiace.
Vďaka 65nm G92 sa odstránil problém – dostatočne malý výrobný proces a preto mohla byť vo februári predstavená prvá mainstreamová grafická karta od nVidie s polovičným počtom výpočtových jednotiek ako high-end a 256bit zbernicou, ktorá podporuje Direct3D 10. Marketingové oddelenie vybralo názov „GeForce 9600 GT“. Predstavuje preto prvú kartu GeForce 9. sérii, napriek tomu, že vychádza z G92 použitého na GeForce 8800 GT/GTS-512 a je zaužívané začať novú sériu predstavením high-end karty. Má to samozrejme psychologický dôvod – výkonnejšie karty „tlačia“ predaj slabších. nVidia odôvodňuje tento krok faktom, že 9600GT ponúka „doposiaľ najlepší“ pomer cena/výkon.
Pravda je, že G94 sa podobá oveľa viac G92 ako G84 na G80. Napriek tomu, že G84 bola po stránke architektúry efektívnejšia ako G80, mala len 1/4 clusterov a 40% šírku zbernice. Výkonom preto zaostávala výrazne za GeForce 8800 GTS. Na druhej strane – GeForce 9600 GT obsahuje 1/2 clusterov G92, rovnakú 256bit zbernicu. Pozitívnym faktom, ktorý stojí za zmienku je aj navýšenie štandardu veľkosti VRAM v mainstreame z 256MiB na 512MiB. Nejedná sa o marketingový ťah, hry si to proste vyžadujú. Všetky grafické karty GeForce 9600 GT sú založené na čipe G94, ktorému budeme venovať ďalšiu stranu.
65nm jadro G94 s celým označením G94-300-A1, A1 znači prvú finálnu revíziu
Mainstreamový čip G94, vyrábaný v 65nm procese u TSMC, je založený na základovej unifikovanej architektúre G80 – recenzia: „Prvé pohľady na architektúru G80” a obsahuje zmeny, ktoré priniesol so sebou čip G92, nakoľko patrí do jeho „vývojovej vetvy“. nVidia škáluje výkon svojich čipov hlavne dvoma spôsobmi – počtom clusterov (nazývaných tiež TPCs = thread processing clusters) a frekvenciou. Keďže je rozsah možných frekvencií obmedzený, je jasné, že dlhé roky sa využíva „osekanie“ čipu na docielenie potrebného – nižšieho výkonu.
Z fyzikálneho hľadiska predstavuje G94 natívny 4 clusterový čip – bez neaktívnych clustrov, ktorý má celkovo ~ 505 miliónov tranzistorov v ~225mm^2 (15x15mm) veľkom jadre. Pre tento krok sa rozhodla nVidia, aby mohla produkovať jadrá relatívne lacno, podobne ako AMD/ATi – RV670. RV670 je napriek tomu menší ~ 193mm², cenovo sa to zhruba vyrovná pre mierne drahší a novší 55nm proces. Presné čísla nie sú samozrejme zverejnené. Vďaka pomerne malým rozmerom môže teda nVidia vyrobiť relatívne veľa – viac ako 240 čipov G94 na 300mm wafery, čo znamená v konečnom výsledku viac GeForce 9600GT grafických kariet a vyššie marže. Rovnako môže neskôr aj klesnúť cena čipov, pokiaľ si to vyžaduje situácia a čip s menším počtom tranzistorov dosahuje ľahšie vyššie frekvencie. Finančne menej výhodná varianta by bola vyrobiť G92 čipy s 8 clustermi a následne polovičku vypnúť. Takýto „G94“ by ale naďalej mal ~754 miliónov tranzistorov a asi by bolo potrebné deaktivovať aj inak funkčné clusteri. Jasne vidieť, v čom je výhoda vyrobiť natívny 4 clusterový G94. Vráťme sa ale k technickým detailom.
Nasledujúci obrázok predstavuje do veľkej miery zjednodušenú schému jadra. Znázornený je hlavne tok dát zo začiatku čipu – thread scheduler až po koniec – ROPs (rasterizačné jednotky), kde sa finálne pixely dostávajú do framebuffera a sú zobrazované na vašej obrazovke.
G94 je plne unifikovaný čip, ktorý podporuje a prevyšuje špecifikácie Direct3D 10 API, sám si zabezpečuje vyťaženie jednotiek a zakrýva latenciu. Z hľadiska architektúry vychádza zo známeho G92, ktorý predstavuje die-shrink G80 s rôznymi zmenami. Tieto prebral aj G94. Z tohoto dôvodu sa pozriem len na novinky a rozdiely voči G80. Odporúčam preto prečítať aj článok „Prvé pohľady na architektúru G80”, kde je architektúra čipu G80 komplexne rozobraná.
Na začiatku čipu bol oproti G80 vylepšený loadbalancing a zmeny sa dotkli aj schedulera, vďaka čomu je docielené vyššie vyťaženie výpočtových jednotiek. Počet výpočtových jednotiek TMUs, ALUs priamo závisí od počtu clusterov. Povedzme si teda, čo obsahuje jeden TPC. Jeden G9x cluster obsahuje rovnako ako G8x cluster – 16 Streaming processing jednotiek alebo „skalárnych“ ALUs, zoradených do 2x8 skupín. Tieto skupiny sú interne nazývané – SMs = streaming multiprocessors. Ďalej vidieť interpolátory pracujúce na rovnakej frekvencii ako ALUs, texturovacie jednotky – TMUs, zložené z 8 adresovacích (TAUs) a 8 filtrovacích (TFUs) jednotiek. Patrí sem ešte scheduler na začiatku každého clusteru, ktorý sa stará o to, aby boli jednotlivé jednotky optimálne vyťažené (nVidia sama hovorí o ~75% vyťaženosti TMUs) a 8KiB veľká L1 cache.
Celkovo obsahuje jadro G94 – 64 ALUs, 32 bilineárnych TMUs a 16 ROPs. Podľa oficiálnych informácií neboli uskutočnené žiadne zmeny na „stream procesoroch“. Tieto si vďaka ručne optimalizovaným tranzistorom zachovávajú schopnosť pracovať na oveľa vyšších frekvenciách ako zvyšok jadra. Kvôli tomu sú stále pomerne drahé na tranzistory v porovnaní so SPs RV670. Pre úplnosť dodám, že scheduler a register file v každom TPC pracujú s polovičnou frekvenciou shader-core. 64 ALUs G94 majú dokopy teoretický aritmetický výkon v single precision: 312 GFLOPs/s. Napriek tomu je možné pre general shading využiť len zhruba 224 GFLOPs/s, nakoľko je druhá MUL sub-ALU dodávajúca 3 FLOPs/s vyťažená koreciou perspektív a SFUs. Viac v časti: Technické údaje grafických kariet. Na rozdiel od konkurencie – RV670, nepodporuje G94, double precision = 64bit presnosť spracovania dát. Pre koncového zákazníka to ale nie je podstatné, nakoľko potrebujú takúto presnosť najmä vedci. Rovnako nie je podporovaný posledný update Direct3D API od Microsoftu zavedený Service Packom 1 pre Windows Vista - Direct3D 10.1, ktorý označuje nVidia ako zbytočný. Po Assasin´s Creed, ktorý vďaka patchu využíval D3D 10.1 a oznámení, že nové hry od Blizzard entertainment (dlho očakávané Diablo 3, Starcraft 2), EA, Sega majú podporovať features Direct3D 10.1 ani nie je prekvapujúce, že nVidia začína meniť názor. Podľa informácií tgdaily je plánovaná jeho podporu vo 4.Q2008. Zatiaľ podporujú menovaný update len grafické karty Radeon HD 3000, 4000 od AMD/ATi a Chrome 400 od S3.
Dostávame sa k TMUs (texturovacím jednotkám), ktorých schopnosti neboli takisto zmenené, zvýšil sa jedine počet adresovacích jednotiek. Zatiaľ čo G80 obsahoval dvakrát viac filtrovacích (TFUs) ako adresovacích jednotiek (TAUs), má tento pomer TFUs: TAUs už každý G9x čip rovnaký – 1:1. Znamená to, že čisto bilineárna texelfillrate G9x TMUs sa zdvojnásobila oproti G8x TMUs. V praxi, kedy sa používa minimálne trilineárne alebo trilineárne anizotropné filtrovanie, nepredstavuje táto zmena výhodu. Toto hovorí nVidia oficiálne. Neoficiálne existujú špekulácie, ktoré hovoria o tom, že TMUs G9x sú z časti zdielané. Možno si to predstaviť ako „unifikované“ TMUs, ktorých časť tranzistorov sa využíva na adresovanie a zároveň na filtrovanie. Bližšie informácie neexistujú, sú to už len divoké dohady. Tieto by ale vysvetľovali vyšší prepad výkonu G9x grafických kariet so zapnutým AF oproti G8x. Z časti pravdivé teda pravdepodobne budú. Nebolo by to prvýkrát, čo nVidia „zneužíva“ výpočtové jendotky.
Relatívne najväčšie zmeny sa uskutočnili na ROPs (rasterizačných jednotkách). Ich schopnosti sa oproti G8x ROPs nelíšia, podporované sú rovnaké formáty, FP-32 blending, multisampling, supersampling transparency adaptive, coverage antialiasing a všetko čo si Direct3D 10 vyžaduje. Vylepšená ale bola ich (Color/Z) kompresia pri určitých nastaveniach a najmä vyšších rozlíšeniach. G94 a G92 by mali vedieť preto lepšie zaobchádzať s dostupnou priepustnosťou a VRAM. Zlepšil sa aj Z-culling, ktorý je teraz mierne inteligentnejší. Tieto vylepšenia si G200 ROPs ponechali . Zatiaľ co G80 obsahoval šesť quadov ROPs, G92 ich obsahuje už len štyri. Tieto štyri ROP quady obsahuje aj G94. Dokopy teda 16 ROPs, ktoré dokážu za takt ukončiť 16 pixelov s Color a Z hodnotami. Zachovaná zostala aj „optimalizácia“ vďaka ktorej dokážu všetky ROPs vypočítať 128 Z-samplov (hĺbkových hodnôt) pokiaľ nie je v „hre“ farba. S farbou klesne táto hodnota na 64 Z-samplov. Oproti G80 to je zníženie, kompenzuje to ale plánovaná vyššia pracovná frekvencia jadra – s rovnakou pracujú aj ROPs. Výkon ROPs, keď vezmeme do úvahy vylepšenia a frekvenciu, by nemal predstavovať limitáciu v čipe.
na rozdiel od G92 podporuje G94 len SLI zapojenie dvoch grafických kariet
Využívaný je naďalej pomerne zastaralý crossbar a tak závisí šírka zbernice priamo úmerne od počtu ROPs - lebo každý ROPs quad je spojený s framebufferom. Zatiaľ čo G80 mal šesť 64bit kanálov, má ich G92/G94 len štyri. Celkovo ponúka G92/G94 zákazníkovi teda 256bit zbernicu, štvornásobne poddelenú. So všetkým tým súvisí aj veľkosť VRAM. Každý 64bit kanál je napojený na dva (32bit) pamäťové čipy. Možnosti kapacity VRAM sú teda len 512MiB alebo 1GiB, čo záleží od veľkosti jedného pamäťového čipu (64MiB alebo 128MiB). V spojení s 900MHz GDDR 3 pamäťou má G94, keď berieme do úvahy aj výkon/teoretické hodnoty, dostatočnú priepustnosť k dispozícii. Problém s nedostatkom priepustnosti má ale G92, ktorý s dvojnásobným výkonom má podľa verzie len 7 až 22% vyššiu dostupnú priepustnosť. Viac už v konkrétnom článku GeForce 9800 GTX(+).
Jadro G92 nie je čo sa týka veľkosti na „hrane“ výrobného procesu a nVidia preto mohla integrovať NVIO - všetky I/O tranzistory spolu s VP do samotného jadra. Ba čo viac, G94 obsahuje rovnako ako G92 vylepšený video procesor. Tento dokáže „úplne“ urýchlovať H.264 codec a čiastočne aj VC-1 videá. nVidia odôvodňuje len čiastočné urýchlenie VC-1 faktom, že nie je tak výpočtovo náročné ako H.264. Do budúcnosti by sme si ale želali viac. Ďalšie PureVideo-HD vylepšenia, ktoré sú dostupné aj pre G92 sa uskutočnili v samotnom ovládači. Prvé dve vylepšenia s názvami Dynamic Contrast Enhancement a Dynamic Blue, Green and Skin Tone Enhancement dokážu počas prehrávania (on the fly) analyzovať HD video a napríklad scénam s nedostatočným kontrastom pridať kontrast a dopasovať, zmeniť farby pozadia. Nová je aj funkcia s názvom Dual-Stream Decode. Vďaka nej je možné prehrávať a urýchľovať dva video streamy. Doposiaľ bolo normálne, že pri prehrávaní HD alebo Blu-ray disku vypol Windows Vista Aero plochu a aktivoval klasický vzhľad. GeForce 9600 GT už túto limitáciu nemá.
Čo sa týka pripojenia čipu a grafickej karty k zvyšku systému, podporuje G94 najnovšiu PCI-Express 2.0 zbernicu. Oproti PCI-Express 1.1 sa priepustnosť zdvojnásobila. G94 GPU ponúka okrem toho natívnu podporu SLI, HDMI a DisplayPort. V referenčný dizajne sú síce navrhnuté dva dual-link-DVI výstupy, board partneri sa ale môžu rozhodnúť či ich nenahradiť vyššie zmieneným HDMI výstupom alebo DisplayPort-om.
Pretaktovaná GeForce 9600 GT od spoločnosti MSI s celým názvom „N9600GT-T2D512-OC“ vo verzii V127, ktorá k nám dorazila do redakcie, sa oproti referenčnej karte líši hneď na prvý pohľad. Momentálna cena v Slovenskej Republike sa pohybuje okolo 3500 SK, mierne viac ako Radeon HD 3850 a podobne ako HD 3870. Za túto cenu dostanete grafickú kartu, ktorá patrí do nižšieho mainstreamu a má ponúkať ešte stále dobrý pomer cena/výkon. Keďže už štandardná GeForce 9600 GT sa má približovať k HD 3870, môžme očakávať, že OC verzia od MSI bude ešte o 3 až 7 % výkonnejšia. Viac si povieme v časti benchmarky, kde dáme odpoveď aj na otázku, či zodpovedá cena danému výkonu. Pozrime sa ale teraz detailnejšie na samotnú grafickú kartu.
MSI GeForce 9600 GT OC korektne rozoznaná utilitkou GPU-Z
PCB a kryt na chladič sú pre GeForce grafické karty v netypickej červenej farbe. Ďalšie zmeny sú „pod kapotou“. MSI na rozdiel od napätia jadra, ktoré je naďalej štandardných 1,1V, zvýšila pracovné frekvencie zo štandardných 650MHz (jadro), 1625MHz (shader-core)a 900MHz (pamäť VRAM) na 700/1680/950MHz. Logicky stúpli aj teoretické technické parametre.
Oproti referenčnej karte má verzia od MSI dvojslotový chladič, ktorý je prichytený na karte pomocou plastovej backplate a zakrýva celú kartu. Hliníkový pasív s množstvom lamiel má medenú základňu, ktorá je poniklovaná. Z nej vychádzajú dve heat-pipe trubice pre lepší odvod tepla. Na samotnom jadre, ktoré chladí, bola nanesená znovu nie najkvalitnejšia strieborná pasta od neznámeho výrobcu. Princíp chladenia je zhodný s inými dvojslotovými chladičmi a pomerne rýchlo vysvetlený. Radiálny 4W ventilátor (12V; 0,34A) YD128015HL značky Y.S.TECH s priemerom 75mm fúka studený vzduch na pasív. Prúd vzduchu sa ohreje a je usmerňovaný plastovou krytkou. Čast sa dostáva von cez záslepku a časť späť do skrinky. Pamäťové čipy a napájacie obvody nemajú pasív a sú chladené len zvyškovým prúdom vzduchu. Pri práci vo Windowse si GeForce 9600 GT nedokáže znížiť automaticky pracovné frekvencie a pracuje naďalej so štandardnými 3D taktami. Napriek tomu je grafická karta v 2D tichá. Bližšie informácie v časti hlučnosť, teploty, spotreba. Podporu Hybrid-SLI neprevzala karta od drahších modelov a tak nie je možné ju vypnúť v 2D a nechať renderovať integrovanú grafickú kartu.
Okrem farby sa PCB nelíši od referenčného a celkovo pôsobí oproti GeForce 8800, Radeon HD 3000 grafickým kartám menej komplexný dojmom. Aj hmostnosť karty je nižšia. Celkovo má karta trojfázové napájanie, ktoré je založené na Richtek „RT 8105“ multifázovom radiči. Dve fázy sú určené pre GPU a zvyšná slúži pre pamäte. Každá fáza má tri MOSFETy. TDP štandardnej GeForce 9600 GT je 95W a napriek podpore PCI-Express 2.0 je potrebné zapojiť 6Pin prídavný VGA konektor na karte, ktorý dodá ďalších 75W. Naša pretaktovaná verzia bude mať pravdepodobne mierne vyššie TDP, presný údaj ale MSI neuvádza.
Súčasťou našich testov bolo aj pretaktovanie jadra a pamätí, vďaka čomu sme súčasne otestovali možnosti OC a kvalitu chladenia/napájania. Zo štandardnej frekvencie 700/1680/950MHz sme boli schopný pomocou známej aplikácie RivaTuner pretaktovať jadro na frekvenciu 780MHz, shader-core na 1800MHz a pamäť na 999MHz. Tieto hodnoty pracovných frekvencií boli s ventilátorom nastaveným na 100% otáčky stabilné aj pri dlhšom zaťažení. Najväčším problémom pri pretaktovaní sa zdá byť teplota, ak jadro prekročí určitú hranicu, stane sa nestabilným. S lepším chladičom by preto malo byť možné ešte vyššie OC.
Na PCB karty sa nachádza dokopy 512 MiB (8x64) 1ns GDDR 3 pamäte Samsung s označením K4J52324QE-BJ1A, ktoré majú pracovné napätie 1,9V a rating 1000MHz (reálne). Na MSI grafickej karte sú prevádzkované s 950MHz, teda pomerne blízko k limitu. V spojení s 256bit externou zbernicou dostávame priepustnosť 60,8 GB/s. To je viac ako má štandardná GeForce 8800 GT (57,6 GB/s). Celková dĺžka karty je 23cm, rovnako ako GeForce 8800 GT. Problémy s nedostatkom miesta v skrinke by teda nemali nastať. GeForce 8800GTX s 27cm dlhým PCB pôsobí o dosť väčším a mohutnejším dojmom:
Na zadnej strane karty je vyvedený jeden HDTV a dva dual-link DVI výstupy podporujúce HDCP. Nie je preto problém vysielať chránený obsah v rozlíšení 2560x1600 pix. Balenie MSI GeForce 9600 GT OC obsahuje aj DVI-to-HDMI prevodník, vďaka ktorému je možné prenášať video signál cez DVI výstup. Možnosť presnášať aj audio signál cez DVI-to-HDMI konektor ako s Radeon HD 2000 až 4000 grafickými kartami nie je podporovaná. Nahradené je to audio káblom, ktorý má konektor na hornej strane PCB, pri SLI konektore. Jeho druhý koniec sa má zastrčiť do S/PDIF na vašej základnej doske alebo zvukovej karte.
Balenie MSI N9600GT-T2D512-OC grafickej karty možno označiť ako bohaté. Okrem klasicky pribalených adaptérov: DVI-to-HDMI, DVI-to-D-Sub, S-Video-to-Composite, Y redukcie 2x molex na 6Pin VGA konektor, HDTV a audio-S/PDIF kábla sa v ňom nachádza aj množstvo užitočného softwaru: „MSI Multimedia Beyond 3D“ CD s multimediálnym obsahom a ovládačmi ForceWare, hra Colin McRae: DIRT, 30 dňová testovacia verzia Pán Prsteňov Online s príslušnými aktivačnými kľúčmi. Nesmie samozrejme chýbať ani rýchla inštalačná príručka MSI kariet a manuál N9600GT série grafických kariet.
Testovacia zostava:
Za poskytnutie produktov by sme sa chceli poďakovať spoločnostiam: Bez ich podpori by nebolo možné uskutočniť túto recenziu.
Použité ovládače:
(Všetky údaje, okrem teoretickej hodnoty Texture Fillrate na GeForce 8800 GTX, sú správne.
Veľmi by ma zaujímalo ako prišli na 38,7 GTexel/s. Správny údaj je 18,4 GTexel/s)
Použité benchmarky:
Syntetické:
Použité programy:
Nastavenia v grafických ovládačoch:
Po dôkladnom premyslení a analýzach kvality obrazu oboch čipov sme sa rozhodli pre nasledujúce nastavenia kvality obrazu v ovládačoch:
nVidia ForceWare:
ATi Catalyst:
Nastavenia kvality sú teda viac-menej rovnaké, aj keď je nemožné dosiahnuť úplne identickú kvalitu. Bližšie sme sa venovali kvalite obrazu v článku: R600 pod drobnohľadom (časti: Porovnanie AA, AF, AI), kde je kvalita obrazu čipu R600 porovnaná s G80. Nakoľko vychádza RV670 z R600 sa ani kvalita obrazu nezmenila voči R600. Rovnako to platí pri porovnaní G92/G94 s G80. Ako vidieť z nastavení, G8x/9x grafické karty poskytujú väčšie možnosti nastavenia kvality a majú s maximálnym nastavením kvalitnejší, takmer dokonalý anisotropný filter.
Fablemark
Shadermark
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
ilustračný obrázok
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Teploty:
Spotreba:
Po predstavení novej Radeon HD 4000 série sa logicky zmenilo postavenie viacerých kariet v desktop segmente. Z RV670 a Radeon HD 3850/3870 sa stal razom len slabší mainstream. Ich cena klesla, ale výkon zostal. Niečo podobné sa stalo aj s GeForce 9600 GT. Radeon HD 4850 teda pokračuje v dobrej tradícii a podobne ako HD 3850 sťažuje nVidii život. Z toho všetkého ale profituje zákazník. Viac sa novej Radeon HD 4850 budeme venovať v budúcej recenzii, ktorá sa dúfam podarí čím skôr zrealizovať.
Vrátim sa k testovanej MSI GeForce 9600 GT OC, ktorá má takmer identickú cenu ako Radeon HD 3870. Je to ale oprávnené, lebo ponúka výkon, ktorý je s vypnutým AA/AF vo väčšine hier pri rozlíšení 1280x1024 veľmi podobný alebo mierne vyšší ako má Radeon HD 3870. So zapnutým AA/AF sa G94 „cíti lepšie“ ako RV670, stráca teda menej výkonu. Skoro vo všetkých testovaných nastaveniach so 4xMSAA, 16xAF je preto pretaktovaná GeForce 9600 GT od MSI výkonnostne nad štandardne taktovanou Radeon HD 3870.
Napriek nižším teoretickým hodnotám sa MSI 9600 GT OC darí priblížiť aj k (dovoľte mi to pomenovanie) legendárnej GeForce 8800 GTX. G94 síce obsahuje polovičný počet výpočtových jednotiek a 256bit zbernicu, oproti G80 ale pracuje s oveľa vyššími frekvenciami. Vďačí za to 65nm procesu. K dobru jej príde určite aj fakt, že moderné hry nepotrebujú taký vysoký aritmetický výkon, ako by si niekto mohol myslieť. Od G80 si G94 zachováva veľmi dobré anizotropné filtrovanie, ktoré nemá (žiaľ) obdobu v Radeon kartách. Čo sa týka vyhladzovania hrán, poskytuje rovnaké možnosti ako G80, voči Radeon kartám je to preto vyrovnané.
Pre koho je teda GeForce 9600 GT OC určená? Zákazníkom, ktorý chcú investovať menej ako 5000 SK do grafickej karty, majú ale záujem hrať nové hry s maximálnymi detailami v 1280x1024. Asi mi dáte za pravdu, že toto je momentálne pole pôsobnosti GeForce 9600 GT, poprípade jej OC verzie. Za 3500 SK ponúka dostatočný výkon na plynulé hratie všetkych dostupných hier v maximálnom rozlíšení, či Direct3D 10. Výnimkou je jedine testovaný Crysis, na ktorý nestačia ani omnoho drahšie karty. Častokrát ešte zostane výkon aj na zapnutie AA/AF ako dokazujú naše výsledky. Tichý dvojslotový chladič a vyššie pracovné frekvencie sú argumenty hovoriacie pre OC verziu od MSI, aj keď veľkú rezervu na zvýšenie pracovných frekvencií majú všetky GeForce 9600 GT.
Ďalšie pozitíva GeForce 9600 GT v porovnaní s Radeon HD 3870 sú určite aj kvalitnejší anizotropný filter a nižšia spotreba v 3D. Radeon HD 3870 tieto nedostatky aspoň čiastočne kompenzuje podporou Direct3D 10.1 a PowerPlay – vďaka čomu má v 2D nízku spotrebu. Tieto schopnosti GeForce 9600 GT nemá. Pre výkonnostne slabšiu Radeon HD 3850 zase hovorí cena a možnosť vyblázniť sa s OC. Konečné rozhodnutie teda ostáva na zákazníkovi, lebo on sám vie najlepšie, čo je preňho to najpodstatnejšie. Odporučiť MSI GeForce 9600 GT OC v každom prípade môžme ľuďom, ktorý nechcú investovať viac ako 3500 SK do grafickej karty, majú ale záujem hrať moderné hry v maximálnych detailoch, občas aj s vyhladzovaním hrán a anizotropným filtrom. Vhod príde aj tichý dvojslotový chladič MSI verzie. Sklamaní určite nebudú.
Na záver by som sa ešte chcel poďakovať internetovému obchodu a veľkoskladu AGEM Computers za vypožičanie testovanej grafickej karty MSI GeForce 9600 GT OC.
Odporúčame prečítať aj:
Úvod
V nasledovnej recenzii sa teda pozrieme na GeForce 9600 GT, jej výkon a tradične aj na architektúru čipu G94. Najprv sa ale vrátime do nedávnej minulosti. Vydaním high-end čipu G80 a uvedením GeForce 8800 série držala nVidia dlho high-end vo vlastnej réžii. Čip G80 bol veľký a drahý, napriek tomu sa ho predalo viac ako sa očakávalo. Situácia v mainstreame bola ale oveľa horšia. Kto nechcel investovať príliš veľa a chcel dostať slušný výkon, nesiahol častokrát po predražených a málo výkonných GeForce 8600, založených na 80nm G84, ale k starším high-end alebo performance kartám. X1950 Pro sa tak dlho ešte veľmi dobre predávala. V danej dobe bol výrobný proces dôvod, prečo neboli vydané lepšie mainstream karty. 80nm proces nedovolil nVidii integrovať väčšie množstvo výpočtových jednotiek do G84, aby sa zároveň dal ešte lacno vyrábať a predaj bol ziskový.Preskočme teraz na koniec roka 2007. AMD/ATi sa podarilo skôr ako bolo plánované vydať grafické karty HD 3000 série založené na RV670. Bližšie sme sa im venovali v recenzii: AMD/ATi Radeon HD 3870 (CrossFire). nVidia bola preto nútená urýchlene vydať GeForce 8800 GT, ktorá predstavuje kvôli cene a výkonu konkurenciu len pre výkonnejší model – HD 3870. Radeon HD 3850 bola dlho bez náprotivku. Zmeny sa museli dotknúť aj výkonu – pôvodný čip G92 so 6 aktívnymi clustermi (nazývané interne TPCs, thread processing clusters, nakoľko spracuvávajú „threads“), dostal ešte jeden, aby sa výkonom dostal nad úroveň RV670. Dôvod bol zlý odhad RV670 zo strany nVidie. Predpokladali, že RV670 bude obsahovať tri R600 clustre. Ako keby nemali dosť problémov, G92 vyrábaný v 65nm procese u TSMC nedosahoval očakávané frekvencie.
referenčná GeForce 9600 GT, takmer na nerozoznanie od GeForce 8800 GT
najväčší konkurent a dôvod vzniku GeForce 9600 GT - AMD/ATi Radeon HD 3850
Keďže vydala nVidia v decembri ešte grafickú kartu založenú na G92 so všetkými aktívnymi clustermi, ktorých je 8: GeForce 8800 GTS-512, dalo sa očakávať, že novom roku budú nasledovať ďalšie takéto karty, ktoré vymenia starí high-end GeForce 8800 GTX/Ultra. Hlavný cieľ nVidie bolo vymeniť drahé G80 lacnejšími G92. Napriek rovnakému počtu clusterov a vyšším frekvenciám nemohla byť G92 tá „pravá“ náhrada za G80, keďže má len 16 vylepšených ROPs – z čoho vyplýva 256bit zbernica a 512MiB VRAM. Vďaka relatívne malej veľkosti 330mm^2 sa ale jadro G92 hodilo pre použitie na GX2 karte, ktorá bola naplánovaná ako konkurent pre HD 3870X2.
Boj o zákazníka, ktorý začala AMD/ATi sa tak pretavil vo viaceré pozitíva. Bola vydaná Radeon HD 3850, ktorá sa líši oproti HD 3870 len frekvenciou a ponúka za danú cenu výborný výkon, dostačujúci na väčšinu Direct3D 10 titulov. Vo viacerých prípadoch je možné zapnúť vyhladzovanie hrán a anizotropný filter. Reakcia nVidie nemala nechať dlho na seba čakať. Nakoniec sa tak stalo až o 3 mesiace.
Vďaka 65nm G92 sa odstránil problém – dostatočne malý výrobný proces a preto mohla byť vo februári predstavená prvá mainstreamová grafická karta od nVidie s polovičným počtom výpočtových jednotiek ako high-end a 256bit zbernicou, ktorá podporuje Direct3D 10. Marketingové oddelenie vybralo názov „GeForce 9600 GT“. Predstavuje preto prvú kartu GeForce 9. sérii, napriek tomu, že vychádza z G92 použitého na GeForce 8800 GT/GTS-512 a je zaužívané začať novú sériu predstavením high-end karty. Má to samozrejme psychologický dôvod – výkonnejšie karty „tlačia“ predaj slabších. nVidia odôvodňuje tento krok faktom, že 9600GT ponúka „doposiaľ najlepší“ pomer cena/výkon.
Pravda je, že G94 sa podobá oveľa viac G92 ako G84 na G80. Napriek tomu, že G84 bola po stránke architektúry efektívnejšia ako G80, mala len 1/4 clusterov a 40% šírku zbernice. Výkonom preto zaostávala výrazne za GeForce 8800 GTS. Na druhej strane – GeForce 9600 GT obsahuje 1/2 clusterov G92, rovnakú 256bit zbernicu. Pozitívnym faktom, ktorý stojí za zmienku je aj navýšenie štandardu veľkosti VRAM v mainstreame z 256MiB na 512MiB. Nejedná sa o marketingový ťah, hry si to proste vyžadujú. Všetky grafické karty GeForce 9600 GT sú založené na čipe G94, ktorému budeme venovať ďalšiu stranu.
Čip G94
65nm jadro G94 s celým označením G94-300-A1, A1 znači prvú finálnu revíziu
Mainstreamový čip G94, vyrábaný v 65nm procese u TSMC, je založený na základovej unifikovanej architektúre G80 – recenzia: „Prvé pohľady na architektúru G80” a obsahuje zmeny, ktoré priniesol so sebou čip G92, nakoľko patrí do jeho „vývojovej vetvy“. nVidia škáluje výkon svojich čipov hlavne dvoma spôsobmi – počtom clusterov (nazývaných tiež TPCs = thread processing clusters) a frekvenciou. Keďže je rozsah možných frekvencií obmedzený, je jasné, že dlhé roky sa využíva „osekanie“ čipu na docielenie potrebného – nižšieho výkonu.
Z fyzikálneho hľadiska predstavuje G94 natívny 4 clusterový čip – bez neaktívnych clustrov, ktorý má celkovo ~ 505 miliónov tranzistorov v ~225mm^2 (15x15mm) veľkom jadre. Pre tento krok sa rozhodla nVidia, aby mohla produkovať jadrá relatívne lacno, podobne ako AMD/ATi – RV670. RV670 je napriek tomu menší ~ 193mm², cenovo sa to zhruba vyrovná pre mierne drahší a novší 55nm proces. Presné čísla nie sú samozrejme zverejnené. Vďaka pomerne malým rozmerom môže teda nVidia vyrobiť relatívne veľa – viac ako 240 čipov G94 na 300mm wafery, čo znamená v konečnom výsledku viac GeForce 9600GT grafických kariet a vyššie marže. Rovnako môže neskôr aj klesnúť cena čipov, pokiaľ si to vyžaduje situácia a čip s menším počtom tranzistorov dosahuje ľahšie vyššie frekvencie. Finančne menej výhodná varianta by bola vyrobiť G92 čipy s 8 clustermi a následne polovičku vypnúť. Takýto „G94“ by ale naďalej mal ~754 miliónov tranzistorov a asi by bolo potrebné deaktivovať aj inak funkčné clusteri. Jasne vidieť, v čom je výhoda vyrobiť natívny 4 clusterový G94. Vráťme sa ale k technickým detailom.
Nasledujúci obrázok predstavuje do veľkej miery zjednodušenú schému jadra. Znázornený je hlavne tok dát zo začiatku čipu – thread scheduler až po koniec – ROPs (rasterizačné jednotky), kde sa finálne pixely dostávajú do framebuffera a sú zobrazované na vašej obrazovke.
G94 je plne unifikovaný čip, ktorý podporuje a prevyšuje špecifikácie Direct3D 10 API, sám si zabezpečuje vyťaženie jednotiek a zakrýva latenciu. Z hľadiska architektúry vychádza zo známeho G92, ktorý predstavuje die-shrink G80 s rôznymi zmenami. Tieto prebral aj G94. Z tohoto dôvodu sa pozriem len na novinky a rozdiely voči G80. Odporúčam preto prečítať aj článok „Prvé pohľady na architektúru G80”, kde je architektúra čipu G80 komplexne rozobraná.
Na začiatku čipu bol oproti G80 vylepšený loadbalancing a zmeny sa dotkli aj schedulera, vďaka čomu je docielené vyššie vyťaženie výpočtových jednotiek. Počet výpočtových jednotiek TMUs, ALUs priamo závisí od počtu clusterov. Povedzme si teda, čo obsahuje jeden TPC. Jeden G9x cluster obsahuje rovnako ako G8x cluster – 16 Streaming processing jednotiek alebo „skalárnych“ ALUs, zoradených do 2x8 skupín. Tieto skupiny sú interne nazývané – SMs = streaming multiprocessors. Ďalej vidieť interpolátory pracujúce na rovnakej frekvencii ako ALUs, texturovacie jednotky – TMUs, zložené z 8 adresovacích (TAUs) a 8 filtrovacích (TFUs) jednotiek. Patrí sem ešte scheduler na začiatku každého clusteru, ktorý sa stará o to, aby boli jednotlivé jednotky optimálne vyťažené (nVidia sama hovorí o ~75% vyťaženosti TMUs) a 8KiB veľká L1 cache.
Technické parametre čipu "G94" | |
Výrobný proces: |
65nm @ TSMC |
Počet tranzistorov: | ~505 miliónov |
Plocha a rozmery jadra: | ~240mm^2; 15,8 x 15,8 mm |
Obal jadra: | flipchip |
Základná konfigurácia: | 32 textúr/ 16 pixelov/ 64x Z |
Zbernica: | 256-bit 4x 64-bit |
Podpora Direct3D: | 10 |
Pripojenie k systému: | PCI-Express 2.0 x16 |
Výstupy: | 2x dual-link DVI, HDMI, HDCP |
Dostávame sa k TMUs (texturovacím jednotkám), ktorých schopnosti neboli takisto zmenené, zvýšil sa jedine počet adresovacích jednotiek. Zatiaľ čo G80 obsahoval dvakrát viac filtrovacích (TFUs) ako adresovacích jednotiek (TAUs), má tento pomer TFUs: TAUs už každý G9x čip rovnaký – 1:1. Znamená to, že čisto bilineárna texelfillrate G9x TMUs sa zdvojnásobila oproti G8x TMUs. V praxi, kedy sa používa minimálne trilineárne alebo trilineárne anizotropné filtrovanie, nepredstavuje táto zmena výhodu. Toto hovorí nVidia oficiálne. Neoficiálne existujú špekulácie, ktoré hovoria o tom, že TMUs G9x sú z časti zdielané. Možno si to predstaviť ako „unifikované“ TMUs, ktorých časť tranzistorov sa využíva na adresovanie a zároveň na filtrovanie. Bližšie informácie neexistujú, sú to už len divoké dohady. Tieto by ale vysvetľovali vyšší prepad výkonu G9x grafických kariet so zapnutým AF oproti G8x. Z časti pravdivé teda pravdepodobne budú. Nebolo by to prvýkrát, čo nVidia „zneužíva“ výpočtové jendotky.
Relatívne najväčšie zmeny sa uskutočnili na ROPs (rasterizačných jednotkách). Ich schopnosti sa oproti G8x ROPs nelíšia, podporované sú rovnaké formáty, FP-32 blending, multisampling, supersampling transparency adaptive, coverage antialiasing a všetko čo si Direct3D 10 vyžaduje. Vylepšená ale bola ich (Color/Z) kompresia pri určitých nastaveniach a najmä vyšších rozlíšeniach. G94 a G92 by mali vedieť preto lepšie zaobchádzať s dostupnou priepustnosťou a VRAM. Zlepšil sa aj Z-culling, ktorý je teraz mierne inteligentnejší. Tieto vylepšenia si G200 ROPs ponechali . Zatiaľ co G80 obsahoval šesť quadov ROPs, G92 ich obsahuje už len štyri. Tieto štyri ROP quady obsahuje aj G94. Dokopy teda 16 ROPs, ktoré dokážu za takt ukončiť 16 pixelov s Color a Z hodnotami. Zachovaná zostala aj „optimalizácia“ vďaka ktorej dokážu všetky ROPs vypočítať 128 Z-samplov (hĺbkových hodnôt) pokiaľ nie je v „hre“ farba. S farbou klesne táto hodnota na 64 Z-samplov. Oproti G80 to je zníženie, kompenzuje to ale plánovaná vyššia pracovná frekvencia jadra – s rovnakou pracujú aj ROPs. Výkon ROPs, keď vezmeme do úvahy vylepšenia a frekvenciu, by nemal predstavovať limitáciu v čipe.
na rozdiel od G92 podporuje G94 len SLI zapojenie dvoch grafických kariet
Využívaný je naďalej pomerne zastaralý crossbar a tak závisí šírka zbernice priamo úmerne od počtu ROPs - lebo každý ROPs quad je spojený s framebufferom. Zatiaľ čo G80 mal šesť 64bit kanálov, má ich G92/G94 len štyri. Celkovo ponúka G92/G94 zákazníkovi teda 256bit zbernicu, štvornásobne poddelenú. So všetkým tým súvisí aj veľkosť VRAM. Každý 64bit kanál je napojený na dva (32bit) pamäťové čipy. Možnosti kapacity VRAM sú teda len 512MiB alebo 1GiB, čo záleží od veľkosti jedného pamäťového čipu (64MiB alebo 128MiB). V spojení s 900MHz GDDR 3 pamäťou má G94, keď berieme do úvahy aj výkon/teoretické hodnoty, dostatočnú priepustnosť k dispozícii. Problém s nedostatkom priepustnosti má ale G92, ktorý s dvojnásobným výkonom má podľa verzie len 7 až 22% vyššiu dostupnú priepustnosť. Viac už v konkrétnom článku GeForce 9800 GTX(+).
Jadro G92 nie je čo sa týka veľkosti na „hrane“ výrobného procesu a nVidia preto mohla integrovať NVIO - všetky I/O tranzistory spolu s VP do samotného jadra. Ba čo viac, G94 obsahuje rovnako ako G92 vylepšený video procesor. Tento dokáže „úplne“ urýchlovať H.264 codec a čiastočne aj VC-1 videá. nVidia odôvodňuje len čiastočné urýchlenie VC-1 faktom, že nie je tak výpočtovo náročné ako H.264. Do budúcnosti by sme si ale želali viac. Ďalšie PureVideo-HD vylepšenia, ktoré sú dostupné aj pre G92 sa uskutočnili v samotnom ovládači. Prvé dve vylepšenia s názvami Dynamic Contrast Enhancement a Dynamic Blue, Green and Skin Tone Enhancement dokážu počas prehrávania (on the fly) analyzovať HD video a napríklad scénam s nedostatočným kontrastom pridať kontrast a dopasovať, zmeniť farby pozadia. Nová je aj funkcia s názvom Dual-Stream Decode. Vďaka nej je možné prehrávať a urýchľovať dva video streamy. Doposiaľ bolo normálne, že pri prehrávaní HD alebo Blu-ray disku vypol Windows Vista Aero plochu a aktivoval klasický vzhľad. GeForce 9600 GT už túto limitáciu nemá.
Čo sa týka pripojenia čipu a grafickej karty k zvyšku systému, podporuje G94 najnovšiu PCI-Express 2.0 zbernicu. Oproti PCI-Express 1.1 sa priepustnosť zdvojnásobila. G94 GPU ponúka okrem toho natívnu podporu SLI, HDMI a DisplayPort. V referenčný dizajne sú síce navrhnuté dva dual-link-DVI výstupy, board partneri sa ale môžu rozhodnúť či ich nenahradiť vyššie zmieneným HDMI výstupom alebo DisplayPort-om.
MSI grafická karta
Pretaktovaná GeForce 9600 GT od spoločnosti MSI s celým názvom „N9600GT-T2D512-OC“ vo verzii V127, ktorá k nám dorazila do redakcie, sa oproti referenčnej karte líši hneď na prvý pohľad. Momentálna cena v Slovenskej Republike sa pohybuje okolo 3500 SK, mierne viac ako Radeon HD 3850 a podobne ako HD 3870. Za túto cenu dostanete grafickú kartu, ktorá patrí do nižšieho mainstreamu a má ponúkať ešte stále dobrý pomer cena/výkon. Keďže už štandardná GeForce 9600 GT sa má približovať k HD 3870, môžme očakávať, že OC verzia od MSI bude ešte o 3 až 7 % výkonnejšia. Viac si povieme v časti benchmarky, kde dáme odpoveď aj na otázku, či zodpovedá cena danému výkonu. Pozrime sa ale teraz detailnejšie na samotnú grafickú kartu.
MSI GeForce 9600 GT OC korektne rozoznaná utilitkou GPU-Z
PCB a kryt na chladič sú pre GeForce grafické karty v netypickej červenej farbe. Ďalšie zmeny sú „pod kapotou“. MSI na rozdiel od napätia jadra, ktoré je naďalej štandardných 1,1V, zvýšila pracovné frekvencie zo štandardných 650MHz (jadro), 1625MHz (shader-core)a 900MHz (pamäť VRAM) na 700/1680/950MHz. Logicky stúpli aj teoretické technické parametre.
Technické parametre: |
|
Názov grafickej karty: |
MSi GeForce 9600 GT OC |
Veľkosť pamäte VRAM: |
512 MiB |
Čip: | G94 |
Pracovná frekvencia jadra: | 700 MHz |
Frekvencia shader core: | 1680 MHz |
Pracovaná frekvencia pamäte: | 950 MHz |
Teoretické peak hodnoty @ 700/1680/950 MHz |
|
Pixel fillrate: |
11 200 Mpixels/s |
Texel fillrate: |
22 400 Mtexels/s |
Z sample rate: |
44 800 Msamples/s |
AA sample rate: | 89 600 Msamples/s |
Aritmetický výkon: | 322,56 GFLOPs/s |
Geometry rate: | 700 Mtriangles/s |
Priepustnosť pamäte: | 60,8 GB/s |
Oproti referenčnej karte má verzia od MSI dvojslotový chladič, ktorý je prichytený na karte pomocou plastovej backplate a zakrýva celú kartu. Hliníkový pasív s množstvom lamiel má medenú základňu, ktorá je poniklovaná. Z nej vychádzajú dve heat-pipe trubice pre lepší odvod tepla. Na samotnom jadre, ktoré chladí, bola nanesená znovu nie najkvalitnejšia strieborná pasta od neznámeho výrobcu. Princíp chladenia je zhodný s inými dvojslotovými chladičmi a pomerne rýchlo vysvetlený. Radiálny 4W ventilátor (12V; 0,34A) YD128015HL značky Y.S.TECH s priemerom 75mm fúka studený vzduch na pasív. Prúd vzduchu sa ohreje a je usmerňovaný plastovou krytkou. Čast sa dostáva von cez záslepku a časť späť do skrinky. Pamäťové čipy a napájacie obvody nemajú pasív a sú chladené len zvyškovým prúdom vzduchu. Pri práci vo Windowse si GeForce 9600 GT nedokáže znížiť automaticky pracovné frekvencie a pracuje naďalej so štandardnými 3D taktami. Napriek tomu je grafická karta v 2D tichá. Bližšie informácie v časti hlučnosť, teploty, spotreba. Podporu Hybrid-SLI neprevzala karta od drahších modelov a tak nie je možné ju vypnúť v 2D a nechať renderovať integrovanú grafickú kartu.
Okrem farby sa PCB nelíši od referenčného a celkovo pôsobí oproti GeForce 8800, Radeon HD 3000 grafickým kartám menej komplexný dojmom. Aj hmostnosť karty je nižšia. Celkovo má karta trojfázové napájanie, ktoré je založené na Richtek „RT 8105“ multifázovom radiči. Dve fázy sú určené pre GPU a zvyšná slúži pre pamäte. Každá fáza má tri MOSFETy. TDP štandardnej GeForce 9600 GT je 95W a napriek podpore PCI-Express 2.0 je potrebné zapojiť 6Pin prídavný VGA konektor na karte, ktorý dodá ďalších 75W. Naša pretaktovaná verzia bude mať pravdepodobne mierne vyššie TDP, presný údaj ale MSI neuvádza.
Súčasťou našich testov bolo aj pretaktovanie jadra a pamätí, vďaka čomu sme súčasne otestovali možnosti OC a kvalitu chladenia/napájania. Zo štandardnej frekvencie 700/1680/950MHz sme boli schopný pomocou známej aplikácie RivaTuner pretaktovať jadro na frekvenciu 780MHz, shader-core na 1800MHz a pamäť na 999MHz. Tieto hodnoty pracovných frekvencií boli s ventilátorom nastaveným na 100% otáčky stabilné aj pri dlhšom zaťažení. Najväčším problémom pri pretaktovaní sa zdá byť teplota, ak jadro prekročí určitú hranicu, stane sa nestabilným. S lepším chladičom by preto malo byť možné ešte vyššie OC.
Na PCB karty sa nachádza dokopy 512 MiB (8x64) 1ns GDDR 3 pamäte Samsung s označením K4J52324QE-BJ1A, ktoré majú pracovné napätie 1,9V a rating 1000MHz (reálne). Na MSI grafickej karte sú prevádzkované s 950MHz, teda pomerne blízko k limitu. V spojení s 256bit externou zbernicou dostávame priepustnosť 60,8 GB/s. To je viac ako má štandardná GeForce 8800 GT (57,6 GB/s). Celková dĺžka karty je 23cm, rovnako ako GeForce 8800 GT. Problémy s nedostatkom miesta v skrinke by teda nemali nastať. GeForce 8800GTX s 27cm dlhým PCB pôsobí o dosť väčším a mohutnejším dojmom:
Na zadnej strane karty je vyvedený jeden HDTV a dva dual-link DVI výstupy podporujúce HDCP. Nie je preto problém vysielať chránený obsah v rozlíšení 2560x1600 pix. Balenie MSI GeForce 9600 GT OC obsahuje aj DVI-to-HDMI prevodník, vďaka ktorému je možné prenášať video signál cez DVI výstup. Možnosť presnášať aj audio signál cez DVI-to-HDMI konektor ako s Radeon HD 2000 až 4000 grafickými kartami nie je podporovaná. Nahradené je to audio káblom, ktorý má konektor na hornej strane PCB, pri SLI konektore. Jeho druhý koniec sa má zastrčiť do S/PDIF na vašej základnej doske alebo zvukovej karte.
Balenie MSI N9600GT-T2D512-OC grafickej karty možno označiť ako bohaté. Okrem klasicky pribalených adaptérov: DVI-to-HDMI, DVI-to-D-Sub, S-Video-to-Composite, Y redukcie 2x molex na 6Pin VGA konektor, HDTV a audio-S/PDIF kábla sa v ňom nachádza aj množstvo užitočného softwaru: „MSI Multimedia Beyond 3D“ CD s multimediálnym obsahom a ovládačmi ForceWare, hra Colin McRae: DIRT, 30 dňová testovacia verzia Pán Prsteňov Online s príslušnými aktivačnými kľúčmi. Nesmie samozrejme chýbať ani rýchla inštalačná príručka MSI kariet a manuál N9600GT série grafických kariet.
Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty:
Radeon HD 3850 512 GDDR3 |
Radeon HD 3870 512 GDDR4 |
HD 3870 512 GDDR4 @ CrossFire |
|
Jadro: |
RV670 | RV670 | 2x RV670 |
Výrobný proces: |
55nm | 55nm | 55nm |
Veľkosť jadra: |
~192 mm2 | ~192 mm2 | 2x ~192 mm2 |
Počet tranzistorov: |
~666 miliónov | ~666 miliónov | ~666 miliónov |
Frekvencia jadra: |
670 MHz |
775 MHz | 2x 775 MHz |
Frekvencia pamäte: |
830 MHz | 1125 MHz |
2x 1125 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 | 512MiB, GDDR4 |
2x 512MiB, GDDR4 |
Frekvencia shadercore: |
670 MHz |
775 MHz |
2x 775 MHz |
Počet TFUs: |
16 | 16 | 2x 16 |
Počet TAUs: |
32 | 32 | 2x 32 |
Počet ALUs: |
64x Vec5 (320 SPs) |
64x Vec5 (320 SPs) |
2x 64x Vec5 (640 SPs) |
Počet ROPs |
16 | 16 | 2x 16 |
Podpora D3D: | 10.1 | 10.1 | 10.1 |
Pixel fillrate: |
10 720 Mpixels/s | 12 400 Mpixels/s | 2x 12 400 Mpixels/s |
Bilinear texelfillrate: |
10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mpixels/s |
Bilinear FP-16 texel fillrate: |
10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mtexels/s |
Z-sample rate: |
21 440 Msamples/s | 24 800 Msamples/s | 2x 24 800 Msamples/s |
AA-sample rate: | 42 880 Msamples/s | 49 600 Msamples/s | 2x 49 600 Msamples/s |
Aritmetický výkon: | 428,8 GFlop/s | 496 GFlop/s | 2x 496 GFlop/s |
Geometry rate: | 670 Mtriangles/s | 775 Mtriangles/s | 2x 775 Mtriangles/s |
Šírka zbernice: |
256 bit | 256 bit | 2x 256 bit |
Priepustnosť pamäte: | 53,1 GB/s | 72 GB/s | 2x 72 GB/s |
GeForce 9600 GT OC |
GeForce 9600 GT
|
GeForce 8800 GT |
GeForce 8800 GTX |
|
Jadro: |
G94 | G94 | G92 | G80 |
Výrobný proces: |
65nm | 65nm | 65nm | 90nm |
Veľkosť jadra: |
~240mm2 | ~240mm2 |
~325 mm2 | ~484 mm2 |
Počet tranzistorov: |
~505 miliónov | ~505 miliónov | ~754 miliónov | ~681 miliónov |
Frekvencia jadra: |
700 MHz |
650 MHz |
600 MHz |
575 MHz |
Frekvencia pamäte: |
950 MHz |
900 MHz |
900 MHz |
900 MHz |
Kapacita, typ pamäte: |
512MiB, GDDR3 |
512MiB, GDDR3 |
512MiB, GDDR3 |
768MiB, GDDR3 |
Frekvencia shadercore: |
1680 MHz |
1625 MHz | 1512 MHz |
1350 MHz |
Počet TFUs: |
32 | 32 | 56 | 64 |
Počet TAUs: |
32 | 32 | 56 | 32 |
Počet ALUs: |
4x Vec16 (64 SPs) |
4x Vec16 (64 SPs) | 7x Vec16 (112 SPs) |
8x Vec16 (128 SPs) |
Počet ROPs |
16 | 16 | 16 | 24 |
Podpora D3D: | 10 | 10 | 10 | 10 |
Pixel fillrate: |
11 200 Mpixels/s |
10 400 Mpixels/s |
9600 Mpixels/s | 13 800 Mpixels/s |
Bilinear texelfillrate: |
22 400 Mtexels/s |
20 800 Mtexels/s |
33 600 Mtexels/s |
18 400 Mtexels/s |
Bilinear FP-16 texel fillrate: |
11 200 Mtexels/s |
10 400 Mtexels/s | 16 800 Mtexels/s | 18 400 Mtexels/s |
Z-sample rate: |
44 800 Msamples/s | 41 600 Msamples/s |
38 400 Msamples/s | 55 200 Msamples/s |
AA-sample rate: | 89 600 Msamples/s |
83 200 Msamples/s | 76 800 Msamples/s | 110 400 Msamples/s |
Aritmetický výkon: | 322,56 GFlop/s |
312 GFlop/s |
508 GFlop/s | 518,4 GFlop/s |
Geometry rate: | 700 Mtriangles/s |
650 Mtriangles/s | 600 Mtriangles/s | 575 Mtriangles/s |
Šírka zbernice: |
256 bit |
256 bit | 256 bit | 384 bit |
Priepustnosť pamäte: | 60,8 GB/s |
57,6 GB/s | 57,6 GB/s | 86,4 GB/s |
Poznámky:
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670 čipe je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom G80, R600:
Testovacia zostava
Každú grafickú kartu sme testovali na nasledujúcej zostave s čisto formatovaným pevným diskom a nanovo nainštalovaným operačným systémom.Testovacia zostava:
- Procesor: Intel Core 2 Extreme 9650 (4 jadrový procesor, 45nm, 2x6MiB = 12MiB L2 cache, 1333MHz) pretaktovaný na 3.4 GHz, 1360 MHz FSB, 10x násobič
- Vodou chladený procesor @ Alphacool Cool Answer PRO
- Základná doska: Gigabyte GA-X38-DQ6 (čipset Intel X38, podpora 1600MHz FSB, 45nm procesorov)
- RAM: 2GiB DDR 2 Corsair, 800MHz @ 816 MHz (4-4-4-12-2T)
- HDD: 750GB Western Digital Caviar 7500AAKS
- Zdroj: X-Spice Croon BF 650, 620W (80+)
- DVD mechanika: Plextor PX-716A
- Operačný systém: Windows Vista Ultimate 32bit, Build: 6000 so všetkými dostupnými záplatami
- Viac informácií ...
Za poskytnutie produktov by sme sa chceli poďakovať spoločnostiam: Bez ich podpori by nebolo možné uskutočniť túto recenziu.
Použité ovládače:
- Catalyst 8.3 WHQL
- ForceWare 174.16 Beta s upraveným INF.súborom
- Sapphire Radeon HD 3870, 512MiB VRAM (RV670), 777/1126 MHz
- CrossFire 2x Sapphire Radeon HD 3870 512MiB VRAM (RV670), 777/1126 MHz
- MSi GeForce 8800GTX 768MiB VRAM (G80), 575/1350/900 MHz
- MSi GeForce 9600 GT OC 512MiB VRAM (G94), 700/1680/950 MHz
(Všetky údaje, okrem teoretickej hodnoty Texture Fillrate na GeForce 8800 GTX, sú správne.
Veľmi by ma zaujímalo ako prišli na 38,7 GTexel/s. Správny údaj je 18,4 GTexel/s)
Použité benchmarky:
Syntetické:
- 3DMark 2006, verzia 1.1.0 s hotfixom
- Fillrate Tester
- FableMark 1.0
- ShaderMark 2.1
- Call of Duty 4: Modern Warfare, DX 9, verzia 1.5
- Call of Juarez D3D 10, Benchmark Demo
- Clive Barker's Jericho, DX9, verzia 1.0
- Colin McRae: DIRT, DX 9, verzia 1.2
- Company of Heroes Opposing Fronts, DX9, verzia 2.101
- Crysis, D3D 10, verzia 1.1
- Enemy Territory: Quake Wars, DX 9, verzia 1.4
- FEAR Perseus Mandate, DX9, verzia 1.0
- Lost Planet: Extreme Condition, D3D10, Benchmark Demo
- Need For Speed: Pro Street, DX 9, verzia 1.0
- PT Boats: Knights of the Sea, D3D 10, Benchmark Demo
- Unreal Tournament 3, DX 9, verzia 1.1
- World in Conflict, D3D 10, verzia 1.006
Použité programy:
Nastavenia v grafických ovládačoch:
Po dôkladnom premyslení a analýzach kvality obrazu oboch čipov sme sa rozhodli pre nasledujúce nastavenia kvality obrazu v ovládačoch:
nVidia ForceWare:
- Texture filtering - Quality: Quality
- Force Mimmaps - Trilinear
- Texture filtering - Negative LOD bias: Clamp
- V-sync: Force Off
- Antialiasing (AA): Application-controlled, 4xMSAA
- Antialiasing - Gamma correction: On
- Anisotropic filtering (AF): Application-controlled, 16x
- Antialiasing - Transparency: Off
ATi Catalyst:
- Catalyst AI: Standard
- Mipmap Detail Level: High Quality
- V-sync: Always Off
- Antialiasing (AA): Use application settings, 4xMSAA (box filter)
- Anisotropic filtering (AF): Use application settings, 16x
- Adaptive Antialiasing: Off
Nastavenia kvality sú teda viac-menej rovnaké, aj keď je nemožné dosiahnuť úplne identickú kvalitu. Bližšie sme sa venovali kvalite obrazu v článku: R600 pod drobnohľadom (časti: Porovnanie AA, AF, AI), kde je kvalita obrazu čipu R600 porovnaná s G80. Nakoľko vychádza RV670 z R600 sa ani kvalita obrazu nezmenila voči R600. Rovnako to platí pri porovnaní G92/G94 s G80. Ako vidieť z nastavení, G8x/9x grafické karty poskytujú väčšie možnosti nastavenia kvality a majú s maximálnym nastavením kvalitnejší, takmer dokonalý anisotropný filter.
Syntetické benchmarky
Fillrate testerFillrate tester je malý ale veľmi užitočný program na meranie fillrate-ov jednotlivých grafických kariet. Na rozdiel od fillrate testera v 3DMarku2006, ktorý je v prípade Single-Texturing veľmi limitovaný priepustnosťou pamäte, dokáže tento program merať rôzne druhy fillratov. My sme nechali prebehnúť všetky merania. Použité shadre v teste sú pomerne krátke a zaťažujú aj dosť priepustnosť, preto sme použili max. možné rozlíšenie, aby sme ťažisko preniesli na fillrate. Testovali sme v rozlíšení 1280x1024, 32-Bit, 24-Bit Z a 8-Bit Stencil buffer s obnovovacou frekvenciou 60Hz.
Vysoká Z-pixelfillrate GeForce 9600 GT OC a 8800GTX vyplýva z výkonu ROPs. Pokiaľ nie je zapnutý AA a ide čisto o aritmetický výkon, pixelshadery, sa dokáže CrossFire so svojimi ~ 1TFlops/s presadiť, napriek veľmi malým optimalizáciám ovládačov. Radeon HD 3870 a CrossFire zapojenie majú ale pomerne veľký prepad fillratov so zapnutým anti-aliasingom voči GeForce 9600 GT OC a 8800 GTX.
Fablemark
Fablemark bol podobne ako jeho nástupca templemark vyvinutý spoločnosťou PowerVR. Predstavuje pomerne staré techdemo s veľkým podieľom overdraw, ktoré malo vtedy ukázať silné stránky TBDR architektúry čipu „Kyro“. Tou je stencil výkon stencil buffera, ktorý limituje v tomto teste. Vďaka tomu poukazuje na ROPs výkon grafických kariet.
GeForce 9600 GT OC podáva v teste veľmi dobré výsledky a poráža aj GeForce 8800 GTX. Je to možné vďaka výkonu ROPs a vylepšeniam, ktoré boli na nich uskutočnené.
Shadermark
Shadermark 2.1 je syntetický benchmark určený na meraniu pixelshader výkonu grafických kariet od tommti-systems. Vďaka častým updatom ide benchmark stále s dobou a podporuje aj Shader Model 3.0. Hodí sa preto k porovnaniu moderných architektúr. Benchmark testuje výkon v 25 rôznych shaderoch, ktoré sú napísané pomocou HLSL (High Level Shader Language).
Všetky testované grafické karty vykazujú pomerne vyrovnaný výkon odpovedajúci ich technickým parametrom. GeForce 9600 GT zaostáva nakoľko jej chýba aritmetický výkon.
3DMark2006
3DMark2006Pravdepodobne jeden z najznámejších benchmarkov od spoločnosti „Futuremark“ vo verzii z roku 2006 má označenie 3DMark2006. Zo šiestich testovaných scén merajú štyri výkon grafickej karty. Dva sú určené pre test výkonu procesora. Pre dosiahnutie očarujúcich scén siahli vývojári po moderných 3D technológiách. Využíva sa Shader Model 3.0, textúry s vysokým rozlíšením, komplexné výpočty tieňov, dynamické osvetlenie, high dynamic range rendering (HDR-R). Futuremark vsadila na FP-16 HDR, ktoré poskytuje momentálne najlepšiu možnú kvalitu, ale je aj najnáročnejšie na výpočet. Testovali sme v default nastavení - rozlíšenie 1280x1024, bez AA/AF.vyťaženie CPU v 1. a 2. GPU teste:
vyťaženie CPU v 2. a 3. GPU teste:
Čiastkové 3Dmark 2006 výsledky: Radeon HD 3870 Radeon HD 3870 @ CF GeForce 8800 GTX GeForce 9600 GT OC Fill Rate - Single-Texturing 6510,461 MTexels/s 12828,796 MTexels/s 6909,842 MTexels/s 5615,875 MTexels/s Fill Rate - Multi -Texturing 12311,284 MTexels/s 23990,219 Mtexels/s 18019,008 MTexels/s 26049,375 MTexels/s Pixel Shader 358,592 fps 676,565 fps 497,400 fps 330,534 fps Vertex shader - Simple 350,397 MVertices/s 713,982 MVertices/s 228,357 MVertices/s 285,892 MVertices/s Vertex shader - Complex 183,559 MVertices/s 357,829 MVertices/s 102,979 MVertices/s 139,199 MVertices/s Shader Particles (SM 3.0) 92,319 fps 165,125 fps 133,404 fps 103,306 fps Perlin Noise (SM 3.0) 173,211 fps 339,090 fps 159,290 fps 100,716 fps
Napriek tomu, že má 3DMark2006 testovať hlavne výkon grafických kariet je dosť limitovaný výkonom procesora aj v GPU testoch. Výnimku predstavuje jedine test HDR 1 - "Canyon Flight". Okrem toho si potrpí tento 3DMark na vertex shader a FP-16 výkon. GeForce 9600 GT sa v 3DMarku 2006 darí, aj napriek nižším teoretickým hodnotám. Vďačí za to najmä vyššiemu geometry rate-u, ktorý vyplýva z vyššej pracovnej frekvencii jadra. Kvalitne optimalizované ovládače sú už viac-menej samozrejmosť. Výsledky preto netreba preceňovať, viac ako výkon v 3DM06 neukazujú.
Call of Duty 4: Modern Warfare
ilustračný obrázok
Tretí diel legendárnej 3D First-person shooter série pre PC od Infinity Ward (CoD 3 bolo pre konzoly), vydaný koncom minulého roka priniesol mnoho nových prvkov.V prvom rade presun do „fiktívnej súčastnosti“ čo hre rozhodne pomohlo. Bojuje sa na blízkom východe, v Rusku, na Ukrajine v okolí Černobylu, či dokonca na lodi uprostred mora. Arzenál opäť tvoria zbrane z reálneho sveta, každú si môžete v multiplayeri prispôsobiť podľa vlastných potrieb. Podobnosť s predchádzajúcim dielom je poznať hlavne v hernom štýle - stála akcia. Hra si našla určite aj vďaka tomu veľa fanušíkov a nadšencov.
DirectX9 engine vlastnej výroby využíva okrem už medzičasom bežného HDR-renderingu aj dynamické tiene, dynamické osvetlenia, depth of field (hĺbkovú neostrosť), parallax mapping a veľmi vydarenú simuláciu dymu. Voči predchádzajúcim dielom bola pridaná vlastná „physics“ engine, ktorá vypočítava priebeh letu guliek (je možné strieľať cez rôzne materiály) a simuluje pád tiel na zem pomocou ragdoll fyziky a predsimulovaných animácií. Engine je optimalizovaný aby využíval aj viac jadrové procesory.
Vďaka vstavanej funkcii multiplayer módu, zaznamenať timedemo sme nahrali vlastné na DM (death match) serveri a mape „Wet Works“. Všetky detaily boli nastavené na maximum a okrem toho sa v danej dobe nachádzalo množstvo hráčov na serveri – o grafickú náročnosť teda bolo postarané.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Z jednotlivých grafov vyťaženia CPU vidieť, že naše timedemo je limitované hlavne grafickou kartou, pre množstvo bojových scén, výbucho, vrtulníkov a súperov. Na multiplayer sa len ťažko optimalizuje, lebo sú jednotlivé bojové scény skoro vždy jedinečné, naše testy teda odrážajú veľmi dobre skutočný výkon v COD4. Prekvapivé je, že napriek starému enginu, ktorý bol takmer kompletne prerobený, reaguje hra veľmi dobre na vyšší pixelshader výkon.
GeForce 9600 GT OC je svojim výkonom vo všetkých testovaných nastaveniach pred jednou a dokonca aj dvomi Radeon HD 3870 v CF. GeForce 8800 GTX sa jej ale nedarí ohroziť, kvôli polovičnému množstvu TMUs a nižšiemu aritmetickému výkonu.
Call of Juarez
ilustračný obrázok
Poľský tvorca Techland siahol po veľmi netradičnom žánre „wester shooter“, navyše berúc na mušku meno iného First-person shooteru. Zahráte si za kňaza Raya McCalla, Billyho Candelu a jeho otca „Juareza“, ktorý stojí na čele tlupy banditov. Vybúriť sa môžete ako v šesťdesiatich rokoch 19. storočia - zajazdiť si na koni, vykradnúť vlak a nebude núdza ani o množstvo pištolníckych súbojov. Titul bol vydaný ešte v roku 2006 a beží na modifikovanom Chrome engine, ktorý dostal o rok neskôr aj podporu Direct3D 10. Hráča presvedčí vďaka hĺbkovej neostrosti (DOF), vydareným particle efektom využívajúce geometry shader, kvalitným textúram s vysokým rozlíšením, FP-16 HDR-renderingu, Parallax Occlusion Mappingu, shadow mapám, veľmi dobrým postavám a efektom. Po grafickej stránke sa preto nemusí za nič hanbiť a obstojí aj v ťažkej konkurencii. Nie je prekvapením, že dá poriadne zabrať moderným grafickým kartám. Pre naše testy sme využili Direct3D10 benchmark demo s maximálnymi detailami a vypnutým zvukom.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Call of Juarez sedí viac Radeon grafickým kartám, nakoľko bol jeho engine upravený v spolupráci s AMD/ATi. To sa nám potvrdilo aj teraz Jednotlivé scény majú v priemere ~ 1 milión polygonov, čo je naozaj veľa a sú limitované skoro vždy grafickou kartou. Podstatný je hlavne pixel, vertex a geometry shader výkon. Svojimi výsledkami je GeForce 9600 GT OC znovu veľmi blízko pri GeForce 8800 GTX a znovu za to môže najmä vyššia geometry rate. Na rovnakú úroveň sa predsa len nedostane, lebo jej chýba pixelshader výkon.
Clive Barkers Jericho
ilustračný obrázok
Je First-person shooter od Mercury Steam, vydaný spoločnosťou Codemasters v minulom roku. Za námetom stojí Clive Barker, anglický spisovateľ hororových kníh, ktorý napísal aj námet pre Undying. V oboch prípadoch budete hrôzou cvakať zubami.
V hre bojujete so svojím tímom v rôznych časových líniach, od Nemecka počas druhej svetovej vojny, cez stredovek a križiacke výpravy až do dôb starovekého Ríma. Napriek tomu, že hráči a stránky nevenovali „Jericho“ veľkú pozornosť, má po grafickej a hernej stránke čo ponúknuť. Vidieť cit pre detail od programátorov, nakoľko je „content“ (prostredie, okolie, textúry) celkom kvalitný a originálny. Využívané sú aj rôzne particle a post processing (depth of field, motion blur) efekty v kombinácii s FP16 HDR-renderingom a parallax mappingom. Majitelia starších grafických kariet, ktoré nedokážu antialiasing v spojení s FP16 renderingom sa preto budú musieť zriecť vyhadzovania hrán.
Na testovanie výkonu sme využili úvodnú sekvenciu vstupu do podzemných tunelov. Detaily boli v hre nastavené na maximum.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Jericho je hra, ktorá má priemerné nároky na výkon a pripomína vo viacerých scénach OpenGL hru Pray. So zapnutým AA/AF sa dokáže GeForce 9600 GT OC viditeľnejšie presadiť voči HD 3870. V jej prospech hrá vyšší počet texturovacích jednotiek a výkonnejšie ROPs.
Colin McRae: DIRT
ilustračný obrázok
Predstavuje šieste pokračovanie známej série závodov Rallye od Codemasters z polovice roka 2007. Colin McRae Rallye Dirt je poháňané DirectX 9 „Neon“ enginom vlastnej výroby, ktorý nemá vo svojej kategórii konkurenciu. FP16 HDR-rendering, dynamické tiene, pekné textúry, vydarené particle efekty a detailné okolie sú charakteristické pre závody.
V hre sa jazdí na asfalte ale aj špinavších povrchoch ako je štrk, piesok, blato. Trate sú navrhnuté podľa skutočnosti. Vďaka kvalitnému audiovizuálnemu poňatiu má hráč pocit ako by bol sedel v skutočnom aute. Na testy sme využili začiatok buggy závodu „Bark River“ v USA.
Kvality obrazu sme boli nútený nastaviť v hre na „high“, nakoľko Radeon HD 3800 grafické karty zobrazovali len čierny obraz s nastavením „ultra“. Okrem toho vykazovalo CrossFire zapojenie so zapnutým vyhladzovaním hrán v hre ako aj v CCC blikajúce, trhajúce textúry divákov na tribúnach. Tento bug v grafických ovládačoch Catalyst je AMD/ATi už dlhšie známy, avšak stále neodstránený.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Hra je veľmi zaťažená na silné viac jadrové procesory a dokáže ich naplno využiť. Dôkazom sú určite aj grafy vyťaženosti CPU. S narastajúcim rozlíšením a AA, AF sú rozdiely medzi grafickými kartami stále väčšie. GeForce 9600 GT OC podáva vo všetkých testovaních nastaveniach hrateľné FPS a približuje sa blízko k GeForce 8800 GTX. S Radeon HD 3870 zvádza vyrovnaný boj - raz je jedna, raz druhá výkonnejšia.
Company of Heroes Opposing Fronts
ilustračný obrázok
Je stand-alone datadisk na veľmi dobrú a obľúbenú RTS (real time strategy) Company of Heroes od Relic Entertainment z prostredia 2. svetovej vojny, ktorý vyšiel ešte v septembri 2007.
Napriek len minimálnym znemám v engine oproti pôvodnej hre má stále čo ponúknuť po grafickej stránke. Na najvyšších detailoch dáva celkom slušne zabrať aj súčasným grafickým kartám. Engine Opposing Fronts obsahuje automaticky okrem DirectX9 aj Direct3D 10 path, ktorý umožňuje HDR-rendering, normalmapping, dynamické osvetlenia, percentage closer filtering pre soft shadows, lepšie particle efekty, vyššie rozlíšené textúry a alpha to coverage pre všetky stromy, kríky a pod. aby boli aj tieto vyhladené
Grafické karty sme testovali v úvodných scénach misie „Wolfheze“ s Direct3D 10 a maximálnymi nastaveniami kvality obrazu.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
V našich testoch bolo väčšinou vyťažené len jedno zo štyroch jadier, napriek tomu, že engine dokáže využiť aj viac jadier. GeForce 9600 GT poskytuje podobný výkon ako jedna Radeon HD 3870. Vďaka nižším prepadom výkonu s AA/AF sa v danom nastavení vie výraznejšie presadiť. Rovnako aj minimálne FPS má rádovo vyššie a na hrateľnej úrovni. Neprekvapuje nás to, lebo hra je v TWIMTBP programe a využíva viaceré Direct3D 10 features.
Crysis
ilustračný obrázok
Názov hry hovorí asi za všetko. First-person shooter Crysis, neoficiálny pokračovateľ Far Cry, lebo využíva jeho ďalej vyvinutý engine s názvom „Cryengine2“, bol už dlho pred vydaním v pozornosti hráčov. Vývojárskym štúdiom je aj v tomto prípade nemecký Crytek, na čele s bratmi Yerli. Spolu s Hellgate: London patrí medzi veľké D3D 10 tituly, ktoré neboli vyvinuté Microsoftom. Hráte úlohu špeciálne vycvičeného amerického vojaka s kódovým označením „Nomad“, využívajúceho oblek „nanosuit“, ktorý bol vysadený so svojím tímom na krásnom ostrove s palmami, patriaci Servernej Kórei. Rovnako ako vo svojej dobe Far Cry, nasadil Crysis myslenú latku grafiky opäť tak veľmi vysoko, že to iným hrám bude trvať určitú dobu, pokiaľ sa k nej priblížia. Engine ponúka po grafickej stránke asi všetko momentálne dostupné a je navrhnutý tak, aby sa v budúcnosti dal ďalej rozširovať pomocou patchov. D3D 10 a 9 path, geometry shadery, dynamické tiene s vysokým rozlíšením, ambient occlusion maps, subsurface scattering,motion blur (neostrosť pri pohybe) & depth of field (hĺbkovú neostrosť), mormal maps, parallax occlusion maps, soft particles, HDR-rendering, pokročilé shadery a množstvo iných ľahôdok sa využíva v hre. Ďalšia informácie ku Cryenginu2 nájdete na oficiálnej stránke Crysis. Nie je prevkapujúce, že aj najsilenjším zostavám dáva hra zaberať.
Naše grafické karty karty sme testovali s nastavením detailov na „very high“, bez anti-aliasingu a anizotropného filtra v 2 rôznych testoch, využívajúc timedemo funkciu. Prvý test „Contact“ predstavuje vstavaný GPU-benchmark. Druhý test s názvom „Paradise Lost“ je vlastné timedemo nahrané v snežnej krajine a je preto extrémne náročné.
vyťaženie CPU:
vyťaženie CPU:
ilustračný obrázok
vyťaženie CPU:
vyťaženie CPU:
Globálne možno povedať, že Crysis sedí viac GeForce grafickým kartám. Predsa len, vývoj prebiehal za pomoci piatich inžinierov nVidie a na GeForce 8800 GTX kartách. Vo výsledkoch GeForce 9600 GT OC sa prejavuje jej slabší aritmetický výkon a hrateľné FPS dosahuje jedine v najnižšom testovanom nastavení. Very high je proste veľa, aj na high-end kartu.
Enemy Territory: Quake Wars
ilustračný obrázok
Nasledovník Wolfenstein – Enemy Territory je poháňaný modifikovaným OpenGL Doom 3 enginom, ktorý bol doplnený o MegaTexture technológiu od známeho Johna Carmacka, soft particles, dynamické tiene, moderné shader efekty, prepočet fyziky a iné. Vďaka MegaTexture je možné aplikovať na statický terén obrovské textúry (až niekoľko GiB veľké s rozlíšením 32768×32768pix) namiesto veľkého množstva menších. Na rozdiel od Doom3 či Quake4 sa preto v ET:QW bojuje na rozsiahlych otvorených priestranstvách. Dynamiku hry dávajú rôzne bojové vozidlá.
Naše grafické karty sme testovali s nastavením kvality obrazu na „high“, okrem shaderov, ktoré boli nastavené na „ultra“ vo vlastnom, pre tieto účeli vyrobenom timedeme. Shadows, soft particles a smooth foliage bolo zapnuté pre dosiahnutie maximálnej kvality obrazu. Timedemo zachytáva tuhé boje vojakov ale aj ozbrojených vozidiel.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Potešujúca je skutočnosť, že engine dokáže vyťažiť všetky naše 4 jadrá Intel QX9650 procesora. GeForce 8800GTX je vo všetkých testoch na prvej pozícii, nakoľko sa jedná o OpenGL engine, ktorý potrebuje veľa texelfillrate. GeForce 9600 GT OC sa ale veľmi blízko k nej približuje a podáva kvalitný výkon, dostačujúci na plynulý zážitok z hry aj v 1280x1024 so 4xMSAA, 16xAF.
FEAR: Perseus Mandate
ilustračný obrázok
Je druhý datadisk po „Extraction point“ na známy hororový First-person shooter F.E.A.R. (First Encounter Assault Recon) vydaný koncom roka 2007. Dej Perseus Mandate sa odohráva súbežne s hlavným dejom FEAR a zmeny sa dočkal hlavne singleplayer. Pridali sa nové misie, postavy, mapy a zbrane. Z grafického hľadiska sa ale skoro nič nezmenilo. Naďalej je využívaný Lithtech DirectX 9 Jupiter EX engine s jeho technikou - parallaxmapping vytvárajúci diery po strelách v povrchoch, bloom spolu s farebnými filtrami na vytvorenie atmosféry, volumetric lighting & lightmapping dovoľujúce komplexné svetelné efekty, podpora Havok physics a kvalitné shadery, textúry. Testy výkonu grafických kariet sme uskutočnili v integrovanom benchmarku s maximálnymi detailami okrem možnosti „soft shadows“.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Žiadne nastavenie nespôsobovalo našim testovaným grafickým kartám väčšie ťažkosti, lebo hra využíva trochu starší engine, ktorý už zaostáva po grafickej stránke za novými. GeForce 9600 GT OC má veľmi podobné výsledky ako Radeon HD 3870 a scénami sa dokáže priblížiť aj k výkonnejšej sestre - 8800 GTX. Môžu za to výkonné aj ROPs.
Lost Planet: Extreme Condition
ilustračný obrázok
Predsavuje jednu z technicky najvyspelejších First-person shooterov vydaných v roku 2007. Ani skutočnosť, že PC verzia vznikla ako kvalitný port z Xbox 360 verzie na tom nič nemení, nakoľko bol MT Framework engine ďalej upravený. Bolo doňho implementovaných množstvo features ako motion blur, depth of field s vyššou kvalitou, „fur“ shadery, FP-16 frame buffer, vylepšený shadow map filtering, ambient occlusion, soft particles, advanced parallax mapping a dostal podporu Direct3D 10. Demo vydané v strede roka 2007 predstavovalo prvé hrateľné Direct3D 10 demo. Dej hry sa odohráva na "snežnej púšti", presnejšie na povrchu planéty E.D.N.III, z ktorej je ľudská kolónia vytláčaná hmyzoidnou rasou Akridov. V úlohe hlavného hrdinu sa dostávate na planétu, vyriešiť tento problém. Zastrieľate si na rozľahlých snežných pláňach, ale aj v temných interiéroch.
Výkonnostné testy sme uskutočnili pomocou vstavanej benchmark funkcie v Direct3D 10 s maximálnymi detailami. Nakoľko obsahuje benchmark dve scény – „snow“ a „cave“, sme testovali len v graficky limitovanom „snow“.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Lost Planet sme boli nútení testovať v menej používaných rozlíšeniach, nakoľko neposkytovala hra s Radeon grafickými kartami na výber rozlíšenia 1280x1024 a 1024x768. Počet polygonov v jednotlivých scénach je len priemerný, okolo 85 000, zaťaženie procesora je malé a počet draw calls je veľmi premenlivý, od 1000 do 4000. V benchmarku sú veľmi vyťažované hlavne TMUs a ALUs. GeForce 9600 GT OC sa výkonom v testoch zaraďuje medzi Radeon HD 3870 a GeForce 8800 GTX. Tento výsledok je adekvátny teoretickým peak honotám ktoré karta má.
Need For Speed: Pro Street
ilustračný obrázok
Predstavuje už jedenáste pokračovanie "autíčkarskej" série Need For Speed, vydané 22. novembra 2007. Za Ryana Coopera si tentoraz zajazdíte legálne závody na Pro Street tratiach cez deň. Autá po dlhej dobe dostali model poškodenia, takže svojmu miláčikov môžete divou jazdou poriadne ublížiť. D3D 9 engine vlastnej výroby bol prepracovaný a trochu viac lesku mu dávajú particle & glow efekty, motion blur, dynamické osvetlenie, nové modely aút a detailné textúry. Preteky sú klasicky doplnené pomerne chytľavou hudbou.Testovali sme v úvodnej scéne preteku „Nevada Highway – Speed Challenge“ s maximálnymi detailami.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Engine dokáže vyťažiť všetky štyri jadrá procesora, čo hodnotíme kladne. V testoch sme sa ale stretli hneď s viacerými prekvapeniami. GeForce 8800 GTX podávala vo všetkých nastaveniach skoro identický výkon a nedokázala sa presadiť ani voči jasne slabším kartám. Dôvodom budú s najväčšou pravdepodobnosťou ovládače. GeForce 9600 GT OC takéto problémy nemala, čo naznačujú aj výsledky - v najvyššom testovanom nastavení dokonca prevalcovala všetky ostatné karty.
PT Boats: Knights of the Sea
ilustračný obrázok
PT Boats: Knights of the Sea je Direct3D 10 techdemo s benchmark funkciou od ruského vývojárskeho štúdia Akella, ktoré by sa malo čoskoro pretaviť v plnohodnotný „námorný simulátor“. Budete mať na starosti flotilu nemeckých, ruských a spojeneckých lodí počas 2. svetovej vojny. Tvorcovia si dali záležať na jednotlivých detailoch a modely lodí, lietadiel, kopírujú presne to, s čím sa bojovalo. Engine využíva pokročilý systém renderovania povrchu oceánu (advanced ocean rendering), soft particles vytvárané pomocou geometry shadera, soft shadows, simulácie odrazov (reflections), svetelných lúčov, HDR-rendering pre streľbu z diel a slnečné odrazy. Hra patrí do nV TWIMTBP programu a vyhovuje preto viac GeForce grafickým kartám. Výkon grafických kariet sme testovali v Direct3D 10 s maximálnymi detailami.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Kvôli veľkému poklesu výkonu so zapnutým programom FRAPS sme neboli schopný vyhotoviť krivky FPS v čase. Scény majú okolo 350 000 polygonov, potrebujú veľmi veľa VRAM a vyťaženie CPU je na nízkej úrovni. Počet draw calls je prekvapivo nízky z dôvodu viacerých optimalizácií. Benchmark vyhoduje viac GeForce kartám, nakoľko sa hra zaraďuje do TWIMTBP programu. Výkon GeForce 9600 GT OC bol na vysokej úrovni, blízko k GeForce 8800 GTX.
Unreal Tournament 3
ilustračný obrázok
Unreal Tournament 3 je štvrtý diel z kultovej 3D First First-person shooter série „Tournament“ od Epic Games založený na novom „state of art“ Unreal Engine 3, ktorý si licencovalo množstvo vývojových štúdií pre svoje hry. Celkovo je tento diel ladený tak, aby nadväzoval na „jednotku“.
Unreal Engine 3 predstavuje prepracovaný DirectX 9 engine (D3D 10 renderpath je na ceste), ktorý je pastvou pre oči, nakoľko využíva HDR-rendering, kvalitné particle efekty, dynamické tiene, množstvo rôznorodých textúry a v neposlednom rade aj deferred shading. Z toho však vyplýva jeden nedostatok - nemožnosť zapnúť anti-aliasing priamo v hre. NVidia ako aj AMD/ATi tento nedostatok odstránili na svojich Direct3D 10 grafických kartách pomocou hacku v ovládačoch. Oficiálne je to možné až keby engine podporoval D3D 10.1. Výrazný je aj shimmering. Shannon a Nyquist by sa asi v hrobe otáčali, keby to videli. Viac sa o technických detailoch môžete dozvedieť priamo na unrealtechnology.
Na otestovanie výkonu našich grafických kariet sme použili integrovanú funkciu – Flyby (prelet) CTF mapou s názvom „Suspense“. Merania sa uskutočnili pomocou programu FRAPS. Detaily v hre boli nastavené na maximum, V-sync (bSmoothFrameRate = False) bola vypnutá.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
Ako vidieť aj na grafoch vyťaženia procesora, UT3 je multithread optimalizovaný, aby vyťažil aj viac jadrové procesory. S narastajúcim rozlíšením a AA,AF klesá postupne vyťaženie CPU, nakoľko sa už grafická karta stáva limitujúcim komponentom. V rozlíšení 1024x768 s 1xAA, AF vidieť ešte jasnú limitáciu procesorom.
V testoch bez AA/AF podávala GeForce 9600 GT OC podobný výkon ako jedna Radeon HD 3870, dostačujúci na plynulé hranie. Zapnutím AA/AF sa rozdiel viac prehĺbi, napriek tomu, že Unreal Tournament vyhovuje viac Radeon grafickým kartám.
World in Conflict
ilustračný obrázok
Dnešné stratégie vyzerajú po grafickej stránke oveľa lepšie ako tie zpred pár rokmi, first-person shootery si však stále držia prvenstvo v použitej technike. Realtime strategy od švédskeho Massive Entertainment vydaná v roku 2007 je ale výnimočná v každom smere. Nielen po hernej, ale aj vizuálnej stránke. Masstech Game Engine obstojí v porovnaní s inými kvalitnými enginami, nakoľko ponúka Direct3D 10 spolu s anti-aliasingom, veľmi vydarené shader efekty (svetelné lúče prechádzajúce cez oblaky, tzv. „God Rays“, len v D3D 10), realistické soft shadows, detailné textúry s vysokým rozlíšením a animácie na vysokej úrovni. Spolu s medzisekvenciami rozprávajúcimi príbeh je vytvorená filmová atmosféra. Fiktívny dej o tom, že studená vojna začiatkom 90. rokov neskončila, ale vyústila v masívnu sovietsku inváziu na pôdu USA pridáva ďalej na atraktivite hry. Naše grafické karty sme testovali v integrovanom benchmarku s maximálnymi detailami.
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
vyťaženie CPU:
V nastaveniach, kde limitoval procesor, sú len veľmi malé rozdieli medzi jednotlivými grafickými kartami. Pri zapnutí 4xAA a 16xAF už ale narastá grafická záťaž a CrossFire zapojenie ukáže oproti jednej Radeon HD 3870 svoj výkon. Na GeForce 8800GTX to ale nestačí, nakoľko je hra optimalizovaná na GeForce karty a patrí do TWIMTBP programu. Engine dokáže využiť všetky jadrá procesora a v určitých scénach je záťaž CPU nadpriemerná, čo je logické, lebo sa jedná o RTS. GeForce 9600 GT OC dosahuje prekvapivo veľmi podobný výkon ako CrossFire zapojenie.
Hlučnosť, teploty, spotreba
Hlučnosť:Moderné grafické karty by nemali byť len výkonné, ale aj ich chladič by nemal pri práci (2D, 3D) vydávať vysoký hluk. Často je hlučnosť štandardného chladiča dôvod pre zákazníka sa rozhodnúť práve pre určitú kartu. V teste rozlišujeme tri kategórie – 2D, 3D a 100%, lebo všetky testované karty si regulujú otáčky ventilátora závisle od teploty.Hlučnosť v sme vo všetkých troch prípadoch merali pomocou hlukomeru „Voltcraft SL-100“, ktorý bol umiestnený v rovnakej výške, 1m od meraného zdroja hluku - grafickej karty. Nakoľko naša zostava nemá skrinku, merali sme s vypnutými ventilátormi. Jediným prídavným zdrojom hluku bol pevný disk a zdroj.
Pomocou alikácie RivaTuner sme manuálne prinútili pracovať ventilátor na 100% a následne zmerali hlučnosť.
Charakteristické úrovne hluku: dBA: štart lietadla (60m) 120 stavba 110 krik (2m) 100 nákladné vozidlo (15m) 90 mestský chodník 80 interiér auta 70 normálny rozhovor (1m) 60 kancelária 50 obývačka 40 spálňa cez noc 30 nahrávacie štúdio 20 šuchot lístia 10
Subjektívne pracuje grafická karta GeForce 9600 GT OC v 2D a 3D ticho. Potvrdzujú to aj merania a porovnania s inými testovanými kartami. V záťaži nemusí ventilátor takmer nikdy zvýšiť otáčky a tak je viac-menej nemožné dostať ventilátor na maximálne otáčky, pokiaľ je zapnuté automatické riadenie otáčok.
Teploty:
Hlučný chladič by grafická karta nemala mať. Podobne je to ale s teplotou – tá by nemala vystúpiť so štandardným chladičom príliš vysoko. Vyššou teplotou sa skracuje životnosť všetkých súčiastok a takisto má negatívny dopad ďalšie zvyšovanie frekvencií - pretaktovanie. Teplotám jednotlivých častí grafických kariet sme sa preto venovali pomerne komplexne. V tabuľke vidieť päť rôznych údajov. 2D merania sa uskutočnili 5 minút po nabootovaní systému do Windows Vista so zapnutou Aero plochou. Merania „pamäť“ a „vzadu“ sme uskutočnili pomocou laserového teplomera „Voltcraft IR-280“ na zadnej strane PCB. Pod pojmom „vzadu“ myslíme zadnú stranu jadra. Hodnota „jadro 2D“ bola vyčítaný pomocou aplikácie RivaTuner. Rovnakým spôsobom sme uskutočnili 3D merania po 30 minútach zaťažujúceho testu HDR 1 – „Canyon Flight“ v 3DMark2006.
Nájsť dobrý pomer medzi hlučnosťou chladiča a teplotou jadra nie je vôbec jednoduché. V 2D sa to v podstate podarilo všetkým kandidátom. Teplotné rozdiely pamäte RAM sú spôsobené rozdielnym typom - GDDR3 vs. GDDR4 a z toho vyplývajúcich pracovných napätí. Z testovaných kandidátov má GeForce 9600 GT OC jednoznačne najchladnejšie jadro v 2D ako aj 3D. Rozdiel oproti ostatným kartám je až prekvapivo dobrý. Môže za to pomerne nízka hustota tranzistorov na mm^2 a stratové teplo, ktoré jadro produkuje.
Spotreba:
Nemohli sme zabudnúť ani na merania spotreby. Pomocou "Voltcraft Energy Monitor 3000" meracieho prístroja sme najprv 5 minút po nabootovaní operačného systému Windows Vista 32bit Ultimate so zapnutou Aero plochou zmerali spotrebu celej zostavy . Tento údaj je označený ako 2D. Maximálna spotreba v 2D, teda "peak 2D" je uvedená pre zaujímavosť. Pre zistenie spotreby v 3D sme nechali 30 minút bežať HDR 1 test "Canyon Flight" v 3DMark2006. Maximálna spotreba v 3D je v tabuľke označená ako "peak 3D".
Rozdiely v spotrebe medzi jednou GeForce 9600 GT OC a Radeon HD 3870 v 2D sú spôsobené hlavne faktom, že jadro G94 nemá schopnosť si znížiť v 2D napätie, pracovnú frekvenciu a vypnúť nepotrebné jednotky ako RV670. Vďaka manuálnemu podtaktovaniu pracovnej frekvencie jadra pomocou aplikácie RivaTuner sa ale dá znížiť celková spotreba v 2D až o 15W. PowerPlay pomohol aj CrossFire zapojeniu udržať celkovú spotrebu systému v 2D pod hodnotou 8800 GTX. V 3D sa už ukazuje presne opačný obraz - napriek rovnakému výkonu spotrebuje v 3D GeForce 9600 GT OC o ~ 40W menej ako Radeon HD 3870.
Zhrnutie, záver
Radeon HD 3850 bola grafická karta, ktorú nVidia len nerada videla na trhu, keďže dlho nemala žiadnu odpoveď na ňu. Svojím pomerom cena/výkon dokázala presvedčiť zákazníkov a vrátiť AMD/ATi stratený podieľ na trhu. Až vo februári sa konečne objavila odpoveď nVidie – čip G94 vo forme GeForce 9600 GT. Prvá GeForce grafická karta s podporou Direct3D 10, ktorá má polovičný počet clusterov – výpočtových jednotiek a 256bit zbernicu. Presne ako predchádzajúce úspešné mainstream grafické karty, napr. GeForce 6600GT. Svojim výkonom ako aj cenou sa GeForce 9600 GT zaraďuje medzi Radeon HD 3850 a HD 3870, často sa dostávajúc k výkonnejšiemu RV670 „na dostrel“.Po predstavení novej Radeon HD 4000 série sa logicky zmenilo postavenie viacerých kariet v desktop segmente. Z RV670 a Radeon HD 3850/3870 sa stal razom len slabší mainstream. Ich cena klesla, ale výkon zostal. Niečo podobné sa stalo aj s GeForce 9600 GT. Radeon HD 4850 teda pokračuje v dobrej tradícii a podobne ako HD 3850 sťažuje nVidii život. Z toho všetkého ale profituje zákazník. Viac sa novej Radeon HD 4850 budeme venovať v budúcej recenzii, ktorá sa dúfam podarí čím skôr zrealizovať.
Vrátim sa k testovanej MSI GeForce 9600 GT OC, ktorá má takmer identickú cenu ako Radeon HD 3870. Je to ale oprávnené, lebo ponúka výkon, ktorý je s vypnutým AA/AF vo väčšine hier pri rozlíšení 1280x1024 veľmi podobný alebo mierne vyšší ako má Radeon HD 3870. So zapnutým AA/AF sa G94 „cíti lepšie“ ako RV670, stráca teda menej výkonu. Skoro vo všetkých testovaných nastaveniach so 4xMSAA, 16xAF je preto pretaktovaná GeForce 9600 GT od MSI výkonnostne nad štandardne taktovanou Radeon HD 3870.
Napriek nižším teoretickým hodnotám sa MSI 9600 GT OC darí priblížiť aj k (dovoľte mi to pomenovanie) legendárnej GeForce 8800 GTX. G94 síce obsahuje polovičný počet výpočtových jednotiek a 256bit zbernicu, oproti G80 ale pracuje s oveľa vyššími frekvenciami. Vďačí za to 65nm procesu. K dobru jej príde určite aj fakt, že moderné hry nepotrebujú taký vysoký aritmetický výkon, ako by si niekto mohol myslieť. Od G80 si G94 zachováva veľmi dobré anizotropné filtrovanie, ktoré nemá (žiaľ) obdobu v Radeon kartách. Čo sa týka vyhladzovania hrán, poskytuje rovnaké možnosti ako G80, voči Radeon kartám je to preto vyrovnané.
Pre koho je teda GeForce 9600 GT OC určená? Zákazníkom, ktorý chcú investovať menej ako 5000 SK do grafickej karty, majú ale záujem hrať nové hry s maximálnymi detailami v 1280x1024. Asi mi dáte za pravdu, že toto je momentálne pole pôsobnosti GeForce 9600 GT, poprípade jej OC verzie. Za 3500 SK ponúka dostatočný výkon na plynulé hratie všetkych dostupných hier v maximálnom rozlíšení, či Direct3D 10. Výnimkou je jedine testovaný Crysis, na ktorý nestačia ani omnoho drahšie karty. Častokrát ešte zostane výkon aj na zapnutie AA/AF ako dokazujú naše výsledky. Tichý dvojslotový chladič a vyššie pracovné frekvencie sú argumenty hovoriacie pre OC verziu od MSI, aj keď veľkú rezervu na zvýšenie pracovných frekvencií majú všetky GeForce 9600 GT.
Ďalšie pozitíva GeForce 9600 GT v porovnaní s Radeon HD 3870 sú určite aj kvalitnejší anizotropný filter a nižšia spotreba v 3D. Radeon HD 3870 tieto nedostatky aspoň čiastočne kompenzuje podporou Direct3D 10.1 a PowerPlay – vďaka čomu má v 2D nízku spotrebu. Tieto schopnosti GeForce 9600 GT nemá. Pre výkonnostne slabšiu Radeon HD 3850 zase hovorí cena a možnosť vyblázniť sa s OC. Konečné rozhodnutie teda ostáva na zákazníkovi, lebo on sám vie najlepšie, čo je preňho to najpodstatnejšie. Odporučiť MSI GeForce 9600 GT OC v každom prípade môžme ľuďom, ktorý nechcú investovať viac ako 3500 SK do grafickej karty, majú ale záujem hrať moderné hry v maximálnych detailoch, občas aj s vyhladzovaním hrán a anizotropným filtrom. Vhod príde aj tichý dvojslotový chladič MSI verzie. Sklamaní určite nebudú.
Na záver by som sa ešte chcel poďakovať internetovému obchodu a veľkoskladu AGEM Computers za vypožičanie testovanej grafickej karty MSI GeForce 9600 GT OC.
Odporúčame prečítať aj:
- Špekulatívne preview G200: high-end ako sa patrí?
- AMD/ATi Radeon HD 3870 (CrossFire)
- Recenzia: 3DMark Vantage
- Prvé pohľady na architektúru G80
- R600 pod drobnohľadom
jutes
M1ch4l
Gudas
M1ch4l
M1ch4l
andrejsvk
JeffoneoN
fobos
Pavol Bobik
fobos
Gudas
Pavol Bobik
sapiq
crux2005