Okrem zaujímavého porovnania po stránke architektúry, či výkonových rozdielov medzi čipmi GF100 a GF104 sa dnes pozrieme na ich deriváty v podobe nereferenčných verzií pod taktovkou Asus a Gigabyte.
Úvod
V minulej recenzii sme Vám predstavili grafické karty od AMD, ktoré mali nasmerované do hráčskeho segmentu. Teraz sa pozrieme na ich konkurenčné modely postavené na architektúre Fermi a ako si cez GF104 nVidia udobrila hráčov po nie veľmi vydarenej GTX 465. Zameriame sa hlavne na nereferenčné verzie v podobe GTX 460 DirectCu TOP od Asusu a dve karty od Gigabyte zo série Super Oveclock GTX 460 a GTX 470.
Aká cesta viedla k úspechu GF104? Pre dosiahnutie lepších prevádzkových vlastností a zníženie nákladov musela nVidia siahnúť na geometrický výkon GF100, zvýšiť jej fillrate, zmenšiť shader cache, odstrániť podporu ECC a čiastočne obmedziť FP64. Takto vzniklo jadro, ktoré už síce nemalo takú prevahu a vlastnosti kariet z profi sféry, nevynikalo v situáciách limitovaných teseláciou tak ako GF100, malo ale dostatočný výkon pri akceptovateľnej spotrebe a dobrých teplotách. Všetko to, čo chýbalo v tomto segmente dovtedy nevýraznej GTX 465 malo teraz podstatne menšie jadro. nVidia aj kvôli výťažnosti vydala najprv GTX 460 1GiB a 768MiB s jedným deaktivovaným blokom. S plne aktivovaným jadrom prišla až v podobe novej generácie s názvom GTX 560.
Obrovské možnosti pretaktovania jadier GF104 ukázalo mnoho výrobcov uvedením viacerých OC verzií. V našich testoch si preveríme vlastné návrhy GTX 460 od firiem Asus a Gigabyte. Obe spoločnosti pripravili karty, ktoré okrem nereferenčného PCB a vyšších frekvencií, ponúkajú vylepšené chladenie. Okrem nich sme do testov zaradili aj (GF100 based) zaujímavú GTX 470 Super Oveclock od Gigabyte.
Asus u svojej GTX 460 DirectCU TOP vsadil na DHT technológiu. Heatpipe trubice chladiča sú zalisované k základni tak, aby s heatspreaderom grafického čipu mali priamy kontakt. Pri dokonalom spracovaní je prenos odpadového tepla z čipu lepší ako pri klasickej základni. Chladiaci účinok umocňujú heatpipe trubice hrubé až 8mm. Karta beží od výroby na vyšších frekvenciách 775/1550/1000, čo je oproti referenčným 675/1350/900 slušný nárast.
U GTX 460 Super overclock použil Gigabyte chladenie Windforce 2X, ktoré využíva okrem technológie Vapor Chamber silu dvoch ventilátorov. Gigabyte sa u verzií SOC pýši programom GPU gauntlet sorting, ktorý na základe určitých kritérií vyberá len tie najlepšie jadrá. Okrem neho je PCB vybavené väčším množstvom medenej vrstvy a osadené kvalitnými súčiastkami, ako napr. cievky s feritovým jadrom, japonské pevné kondenzátory, či mosfety s nižším RDS. Karta je svojimi taktmi 815/1630/1000MHz pravdepodobne najrýchlejšia GTX 460 v predaji.
GTX 470 Super Oveclock má oproti pomalšej GTX 460 vylepšené chladenie WindForce 3X, ktoré by malo ponúknuť okrem nižších teplôt konečne tichú prevádzku 470tky aj počas hrania hier. Tak ako aj u GTX 460 SOC je samozrejmosť použitie kvalitných súčiastok a výberových jadier. Frekvencie karty boli zdvihnuté výrobcom zo štandardných 607/1215/873 na 700/1400/873MHz.
Ako dopadli karty v testoch a či sa oplatí priplácať za tieto pretaktované modely uvidíte ďalej v recenzii. Poďme sa ale najprv pozrieť bližšie na GF104.
Superskalárne GF104: evolúcia GF100?
Plné jadro GF100 má 4 GPCs (Graphic Processing Clusters) clustre, 6x 64bit pamäťových radičov s 48 ROPs a L2 cache, Host Interface a plánovač s názvom GigaThread Engine, ktorý rozdeľuje prácu vo vnútri jednotlivých GPCs. Každý GPC obsahuje Raster Engine a 4 SMs (Streaming Multiprocessors).
Zmena u GF104 nastala hlavne v štruktúre samotných GPCs. Jeden SM už nemá 32 Cuda jadier ako u GF100, ale po novom 48. Zdvojnásobil sa aj počet SFUs a TMUs. SFU - špeciálna jednotka, ktorá dokáže spracovať transcendentálne inštrukcie, ako napríklad sin(x), cos(x), 1/x, 2x, log2(x). Každá SFU zvláda jednu takúto inštrukciu za takt. Pozitívnou zmenou bol aj nárast počtu textúrovacích jednotiek na jeden GPC cluster. Aj keď má GF104 len polovicu GPCs, disponuje rovnakým počtom textúrovacích jednotiek ako GF100. Okrem iného textúrovacie jednotky už vedia filtrovať s FP16 v plnej rýchlosti, zatiaľ čo GF100 len v polovičnej.
L2 cache kvôli súvislosti s pamäťovými radičmi klesla na veľkosť 512kB pre 256bit verziu, pre 192bit na 384kB (GF100 má pri plnej 384bit zbernici 768kB). S počtom pamäťových radičov úzko súvisí aj počet ROPs. Každej skupine 8ich ROPs pripadá jeden 64bit pamäťový radič. Zvyšok GPCs ostal u GF104 rovnaký. Každý SM má k dispozícii 64kB konfigurovateľnú pamäť, ktorú je možné prideliť 48kB pre L1 cache a 16kB pre zdieľanú pamäť, resp. 16kB pre L1 cache a 48kB pre zdieľanú pamäť. Aj keď jej veľkosť oproti GF100 neklesla, zvýšil sa počet Cuda jednotiek, ktoré sa teraz o ňu delia.
Samozrejmosťou je jeden Polymorph engine na jeden SM. Táto jednotka je zodpovedná za spracovanie geometrických operácií.
Zaujímavou zmenou je využitie jednotlivých blokov SM u GF104. Zatiaľ čo u čipu GF100 je v každom SM:
- 1. blok (16) Cuda jadier
- 2. blok (16) Cuda jadier
- 16 Load/Store jednotiek
- 4 TMU
- 4 SFU
a využitie blokov Cuda jadier, LD/ST jednotiek, a SFUs je zabezpečené pomocou TLP (Thread Level Parallelism) cez jeden warp sheduler a jednu Dispatch jednotku. SM u GF100 môže spracovanie inštrukcií dvoch warpov (1warp = 32threadov) odoslať v jednom cykle akýmkoľvek dvom blokom.
U GF104 je ale situácia iná, má o jeden blok Cuda jadier viac, ale stále rovnaký počet warp shedulerov.
- 1. blok (16) Cuda jadier
- 2. blok (16) Cuda jadier
- 3. blok (16) Cuda jadier
- 16 Load/Store jednotiek
- 8 TMU
- 8 SFU
Pri použití TLP by ostal stále jeden blok Cuda jadier nevyužitý. Preto, aby neidlovalo viacero jednotiek, musela nVidia zmeniť spôsob využitia jednotlivých blokov. Ako to dokázala s použitím rovnakého množstva warp shedulerov? "Jednoducho", použitím superskalárnej metódy ILP (Instruction Level Parallelism).
Každý warp sheduler je pripojený u GF104 na 2 dispatch jednotky. V najideálnejšom prípade, ak sú na sebe inštrukcie v threade nezávislé, warp sheduler ich rozdelí pre dva bloky, ktoré ich spracujú paralelne. Takto dokáže odoslať inštrukcie 4 z 5blokov, zatiaľ čo GF100 len 2 zo 4. SM spracováva inštrukcie superskalárne na základe ich analýzy vo warp shedulery. Nevýhodou je ak sú inštrukcie závislé, vtedy warp sheduler odošle inštrukcie len 1 bloku v cykle. Využitie klesne len na 2bloky z 5. Čo je pri spracovaní inštrukcií Cuda jadrami vyťaženie 256 z celkového počtu 384, teda len 66%.
Pre zníženie nákladov a zmenšenie čipu nVidia obmedzila "profi" vlastnosti GF100 v podobe výpočtov s DP, u G104 vie len jedna časť SM (16 zo 48Cuda jadier) FP64. Okrem toho GF104 prišla o podporu ECC, čo je ale u hráčskeho obecenstva nezaujímavé.
Technické detaily
GTX 460 je dostupná v troch verziách: GTX 460 1GiB, GTX 460 768MiB a GTX 460SE 1GiB.
GTX 460 1GiB a 768MiB majú 336Cuda jadier, 56TMUs a 7Polymorph engine. Rozdiel vo veľkosti pamätí ubral 768Mib modelu na veľkosti zbernice 192bit (3x64bit), na počte ROPs 24 (3x8) a na veľkosti L2 cache pamäte 384kB (192x2kB). 1GiB verzia má 256bit (4x64bit), 32ROPs (4x8) a 512kB L2 cache.
Model GTX 460SE 1GiB má od prvých dvoch modelov o jeden blok SM menej. Celkovo teda 288Cuda jadier, 48TMUs, 6Polymorph engine, 256bit, 32ROPs a 512kB L2 cache.
Zhrnutie technických parametrov GTX 460 1GiB referenčného modelu (teoretické hodnoty) v tabuľke
GeForce GTX 460 1GiB | GeForce GTX 465 | GeForce GTX 470 | GeForce GTX 480 | |
Jadro: | GF104-325 | GF100-030 | GF100-275 | GF100-375 |
Výrobný proces: | 40nm | 40nm | 40nm | 40nm |
Veľkosť jadra: | ~367 mm^2 | ~550 mm^2 | ~550 mm^2 | ~550 mm^2 |
Počet tranzistorov: | ~1950 miliónov | ~3000 miliónov | ~3000 miliónov | ~3000 miliónov |
Počet aktívnych clustrov: | 7 | 11 | 14 | 15 |
Frekvencia jadra: | 675 MHz | 608 MHz | 608 MHz | 700 MHz |
Frekvencia pamäte: | 900 MHz | 802 MHz | 837 MHz | 924 MHz |
Kapacita, typ pamäte: | 1 GiB, GDDR5 | 1 GiB, GDDR5 | 1280 MiB, GDDR5 | 1536 MiB, GDDR5 |
Frekvencia shadercore: | 1350 MHz | 1215 MHz | 1215 MHz | 1401 MHz |
Počet TFUs: | 56 | 44 | 56 | 60 |
Počet TAUs: | 56 | 44 | 56 | 60 |
Počet ALUs: | 7x Vec48 (336 SPs) | 11x Vec32 (352 SPs) | 14x Vec32 (448 SPs) | 15x Vec32 (480 SPs) |
Počet ROPs | 32 | 32 | 40 | 48 |
Podpora Direct3D: | 11 | 11 | 11 | 11 |
Pixel fillrate: | 21 600 MPixels/s | 19 456 MPixels/s | 24 320 MPixels/s | 33 600 MPixels/s |
Bilinear texelfillrate: | 37 800 MTexels/s | 26 752 MTexels/s | 34 048 MTexels/s | 42 000 MTexels/s |
Bilinear FP-16 texel fillrate: | 18 900 MTexels/s | 13 376 MTexels/s | 17 024 MTexels/s | 21 000 MTexels/s |
Z-sample rate: | 86 400 MSamples/s | 77 824 MSamples/s | 97 280 MSamples/s | 134 400 MSamples/s |
AA-sample rate: | 132 800 MSamples/s | 155 648 MSamples/s | 194 560 MSamples/s | 268 800 MSamples/s |
Single precision aritmetický výkon: | 907,2 GFLOP/s | 855,36 GFLOP/s | 1088,6 GFLOP/s | 1344,96 GFLOP/s |
Double precision aritmetický výkon: | 75,6 GFLOP/s | 106,92 GFLOP/s | 136,08 GFLOP/s | 168,12 GFLOP/s |
Geometry rate: | 1350 MTriangles/s | 1824 MTriangles/s | 2432 MTriangles/s | 2800 MTriangles/s |
Šírka zbernice: | 256 bit | 256 bit | 320 bit | 384 bit |
Priepustnosť pamäte: | 115,2 GB/s | 102,66 GB/s | 133,92 GB/s | 177,4 GB/s |
Asus GTX 460 DirectCu TOP
Spoločnosť Asus pripravila pre 1GiB verziu dva varianty založené na priamom kontakte jadra so základňou. Jeden má referenčné takty a druhý pod názvom TOP s pretaktovaním na 775/1550/1000MHz. U oboch prípadoch je PCB vlastným návrhom výrobcu a jeho dĺžka je 21cm. Kartu ale o 15mm predĺžuje jej veľký pasív. Balenie karty od spoločnosti Asus vyzerá následovne (do redakcie prišla karta v krabici pre nepretaktovanú verziu, ilustrácia z oficiálnej stránky)
Medzi príslušenstvom nájdete 2x napájanie molex-6pin, adaptér DVI-> HDMI, adaptér DVI ->D-SUB, manuál, CD s ovládačmi a so softvérom pre pretaktovanie (Smart Doctor) a obal pre cd/dvd disky.
Chladenie pozostáva z hliníkového pasívu, jedného ventilátora a troch 8mm hrubých heatpipe trubíc. Tie majú priamy kontakt s heatsprederom GPU. Asus vybavil kartu aj chladičom pre VRM. Celkovo zaberie chladenie karty dva sloty.
O ofukovanie pasívu sa stará jeden 92mm ventilátor.
O reguláciu napätia pre jadro sa cez 5-fázové napájanie stará čip ASP0905. O napájanie pamätí sa stará často používaný kontrolér uP6101. Pamäte má od Samsungu, konkrétne 8modulov 1Gbit K4G10325FE-HC05. Ich menovitá frekvencia od výrobcu je 1000MHz, na ktorej aj u TOP verzii pracujú.
Z jadra GF104 je aktívnych 7SMs, z čoho vyplýva 336SPs a 56TMUs. Pretaktovaná verzia má mierne zvýšené napätie v záťaží z referenčných 0.987V na 1V. Pri 2D je klasických 0.875V. Jadro GF104 osadené na karte bolo vyrobené v 23. týždni.
GTX 460 DirectCU TOP má výstupy pre 2x DL-DVI-I a jeden mini HDMI. Pre mGPU zapojenie má len jeden SLI konektor, čo umôžňuje zapojenie maximálne dvoch kariet. O napájanie sa okrem PCIe slotu (75W) starajú 2x6pin napájacie PCIe konektory.
Gigabyte GTX 460 Super Overclock
Jedná sa pravdepodobne o najrýchlejšiu GTX460 1GiB na trhu, jej takty boli zo štandardných 675/1350/900MHz dvihnuté až na 815/1630/1000MHz. PCB je tak ako u 470SOC dielom inžinierov firmy Gigabyte. Je dlhé 24cm, o 3cm dlhšie ako referenčná verzia. Balenie karty od spoločnosti Gigabyte vyzerá následovne (do redakcie prišla len holá karta, ilustrácia z oficiálnej stránky)
Medzi príslušenstvom by ste mali nájsť: HDMI kábel, 2x 6pin napájanie z molexu, adaptér DVI to VGA, manuál, CD s ovládačmi a so softvérom pre pretaktovanie (Smart Tuner OC guru).
O lepšiu efektivitu chladenia sa starajú dva tiché 80mm PWM ventilátory naklonené v smere, ktorý podľa výrobcu zaručuje ideálny odvod tepla z veľkého pasívu. Časť tepla uniká von z bedne a časť ostáva v nej. Prechod tepla medzi medenenou základňou chladiča a mohutným rebrovaním zaručujú štyri medené 6mm heatpipe. Chladenie karty zaberie dva sloty.
Detail na jeden z dvoch 80mm ventilátorov.
Karta má 6 fázové napájanie pre jadro (každá fáza má na zadnej strane PCB svoju LED diódu pre zobrazenie vyťaženia) a 1 pre pamäte. Referenčná verzia má 5fázové napájanie. Pre väčšiu stabilitu napätia Gigabyte osadil na zadnej strane PCB jeden kondenzátor od Nec/Tokin.
Karta má pamäte od Samsungu, konkrétne 8modulov 1Gbit K4G10325FE-HC04. Tieto pamäte majú vyššiu menovitú frekvenciu ako ostatné modely GTX 460, jej hodnota je 1250MHz.
Jadro GF104 osadené na tejto karte bolo vyrobené v 33. týždni. Z neho je aktívnych 7SMs, z čoho vyplýva celkovo 336SPs a 56TMUs. Pretaktovaná verzia od Gigabyte má mierne zvýšené napätie v záťaží z referenčných 0.987V na 1.025V. Pri režime 2D je klasických 0.875V.
GTX 460 Super Overclock má výstupy pre 2x DL-DVI-I a jeden mini HDMI. Pre mGPU zapojenie má len jeden SLI konektor, čo umôžňuje zapojenie maximálne dvoch kariet. O napájanie sa okrem PCIe slotu (75W) starajú 2x6pin napájacie PCIe konektory.
Gigabyte GTX 470 Super Overclock
Jedná sa o jednu z najrýchlejších GTX 470 na trhu (ak nie vôbec najrýchlejšia). Jej takty boli zo štandardných 608/1215/837MHz výrobcom dvihnuté na 700/1400/837MHz. PCB je tak ako u 460SOC dielom inžinierov firmy Gigabyte. Je dlhé 29cm, rovnako ako GTX 480. Balenie karty od spoločnosti Gigabyte vyzerá následovne
Karta je zabalená v antistatiockom sáčku a chránená penovou výplňou.
Medzi príslušenstvom by ste mali nájsť: HDMI kábel, 2x 6pin napájanie z molexu, adaptér DVI to VGA, manuál, CD s ovládačmi a so softvérom pre pretaktovanie (Smart Tuner OC guru).
O náročné jadro GF100 sa u tejto SOC verzii starajú až tri tiché 80mm PWM ventilátory. Sú nainštalované na heatsinku a naklonené v smere, ktorý podľa výrobcu zaručuje ideálny odvod tepla z veľkého pasívu. Časť tepla uniká von z bedne a časť ostáva v nej. Prechod tepla medzi medenenou základňou chladiča a mohutným rebrovaním zaručujú tri poniklované 6mm heatpipe. Chladenie karty zaberie dva sloty.
Detail na jeden z troch 80mm ventilátorov (ten istý typ ako u GTX 460 Super Overclock).
Karta má 12 fázové napájanie pre jadro (každá fáza má na zadnej strane PCB svoju LED diódu pre zobrazenie vyťaženia) a 2 pre pamäte. Referenčná verzia má 5fázové napájanie. Pre väčšiu stabilitu napätia Gigabyte osadil zadnú stranu PCB piatimi kondenzátormi od Nec/Tokin (4 pre jadro, 1 pre pamäte).
Pamäte má karta od Samsungu, konkrétne 10modulov 1Gbit K4G10325FE-HC05. Ich menovitá frekvencia od výrobcu je 1000MHz, u tejto karty pracujú tak ako u referenčného modelu na frekvencii 837MHz.
Jadro GF100 osadené na tejto karte bolo vyrobené v 22. týždni. Z neho je aktívnych 14SMs, z čoho vyplýva celkovo 448SPs a 56TMUs. Pretaktovaná verzia od Gigabyte má mierne výššie napätie v záťaží 1V. V režime 2D je napätie jadra 0.875V.
GTX 470 Super Overclock má výstupy pre 2x DL-DVI-I a jeden mini HDMI. Pre mGPU zapojenie má dva SLI konektory. O napájanie sa okrem PCIe slotu (75W) starajú 2x6pin napájacie PCIe konektory.
Testovacia zostava a metodika testovania
Testovacia zostava:
- Procesor: Intel Core i7 930 (vypnuté HT aj TURBO) pretaktovaný na 3.81 GHz, chladený Noctua NH-U12P SE2
- Základná doska: EVGA X58 FTW3 (Bios 77)
- RAM: 6GiB DDR3 Mushkin Blackline (1456 MHz, 7-7-7-21-1T, 1.45V)
- HDD: 500GB Samsung
- Zdroj: Enermax Infinity 650W
- DVD mechanika: Samsung
- Operačný systém: Windows 7 64bit, so všetkými dostupnými záplatami
- Monitor: Samsung SyncMaster 305T+ (30" LCD, max. rozlíšenie 2560x1600)
- Skrinka: SilverStone FT02B-W
Každá grafická karta je otestovaná vždy s novou inštaláciou operačného systému. Následne sú nahodené posledné updaty a ovládače. Všetky šetriace funkcie sú vypnuté.
Testované grafické karty a použité ovládače:
nVidia GeForce
- Asus GTX 460 DirectCU TOP (775/1.550/1.000 MHz, 1 GiB GDDR5) @ WHQL 263.00
- merania s referenčnými taktmi (675/1350/900 MHz)
- Asus GTX 470 (607/1.215/837 MHz 1,28 GiB GDDR5) @ WHQL 263.00
- Gigabyte GTX 460 Super Overclock (815/1.630/1.000 MHz, 1 GiB GDDR5) @ WHQL 263.00
- Gigabyte GTX 470 Super Overclock (700/1400/837 MHz, 1280 MiB GDDR5) @ WHQL 263.00
AMD Radeon
- Gigabyte HD 6870 (900/1.050 MHz, 1 GiB GDDR5) @ WHQL 10.12Preview
- Sapphire HD 6850 Toxic (820/1.100 MHz, 1 GiB GDDR5) @ WHQL 10.12Preview
- merania s referenčnými taktmi (775/1000 MHz)
Použité rozlíšenia v teste:
- 1.680 x 1.050
- 1.920 x 1.200
- 2.560 x 1.600
Každé rozlíšenie bolo otestované s 4xMSAA/8xMSAA a 16xAF. Pre náročnosť na grafický výkon je rozlíšenie 2.560 x 1600 doplnené o režim 1xMSAA. Testy sú vykonané vždy s maximálne možnými detailami, ktoré nám umožňujú jednotlivé hry nastaviť. Vyhladzovanie hrán a filtrovanie textúr je, pokiaľ to menu hry umožňuje, nastavené priamo v ňom. Ak nie, tieto nastavenia boli vynútené pomocou ovládačov grafických kariet. Pre minimalizovanie nepresnosti je každá grafická karta testovaná 3x vo všetkých testoch. Priebehy hier sú zaznamenávané vždy programom FRAPS.
Testované hry:
- Direct3D 9:
- Call of Duty: Black Ops (verzia )
- Mass effect 2 (verzia 1.2)
- Direct3D 10:
- Just Cause 2 (verzia 1.1)
- Anno 1404 (verzia 1.2.2619)
- Crysis Warhead (verzia 1.1)
- Direct3D 11:
- Metro 2033 (verzia 1.1)
- Alien vs Predator (benchmark verzia 1.3)
- Colin McRae: Dirt 2 (verzia 1.1)
- S.T.A.L.K.E.R. Call of Pripyat (verzia 1.6.02)
- Battlefield: Bad Company 2 (verzia )
Syntetické benchmarky:
- Direct3D 11:
- 3D Mark 11 (verzia 1.0.1)
- Unigine Heaven (verzia 2.1)
Za poskytnutie 30" LCD monitora SyncMaster 305T+ ďakujeme spoločnosti SAMSUNG
Za poskytnutie hier Battlefield Bad Company 2 a Mass Effect 2 ďakujeme spoločnosti EA
Za poskytnutie benchmarku 3DMark 11 ďakujeme spoločnosti Futuremark
Nastavenie ovládačov grafických kariet:
Kvôli zachovaniu čo najväčšej zhody z hľadiska kvality obrazu bolo u sérii HD 6800 použité AI standard v režime HQ. Dôvod prečo neboli použité „default“ nastavenia (režim Quality) ako väčšina redakcií, je ich agresívnejšie nastavenie od Catalystov verzie 10.10 a tým zvýšenie výkonu o niekoľko percent. Momentálne ale nie je možné dosiahnúť identickosť obrazu porovnateľnú s GeForce kartami. Aj napriek takmer odstránenému AF bandigu u novej generácie, AMD karty trpia väčším shimmeringom textúr. Preblikávanie textúr je u HD 6800 s CCC 10.10 dokonca agresívnejšie ako to bolo u jeho predchodcu HD 5800. Nastavenie nVidia Control panelu je okrem zmeny LOD a manažmentu napájania ponechané v defaultných hodnotách. Viac v screenoch:
3DMark 11, Unigine Heaven
3DMark 11
3DMark 11 od spoločnosti Futuremark je najnovšia verzia veľmi obľúbeného benchmarku, ktorá v porovnaní so staršou verziou Vantage prináša využitie nových funkcií najnovšieho Direct X API od Microsoftu, konkrétne Direct3D 11 (teselácia, DC 5.0 a multithreading). Zmena nastala aj v teste fyziky, namiesto PhysX je použitý open-source Bullet Physics. Grafické karty sme testovali v režime Extreme Preset, ktorý z troch prednastavených režimov predstavuje svojím nastavením najvyššiu záťaž kladenú práve na grafickú kartu a v menej náročnom Performance Presete. Pre Extreme Preset je definované rozlíšenie 1920x1080 so zapnutým 4xMSAA a 16xAF. Pre Performance preset to je 1280x720 1xMSAA a 1xAF.
Unigine Heaven
Unigine Heaven bol pri svojom uvedení vôbec prvý syntetický benchmark využívajúci možnosti Direct3D 11 rozhrania. Okrem neho obsahuje podporu pre D3D 9, 10 ,11 a OpenGL. Najvýraznejšou časťou testu je hardvérová teselácia, ktorá je doplnená o SSAO, Parallax Occlusion Mapping, 64bit HDR rendering či DirectCompute. V poslednej verzii 2.1 bola pridaná podpora pre OpenGL 4.0 a techniky stereoskopickej projekcie. Výkon GPUs sme testovali s 4xMSAA, 16xAF v rozlíšeniach 1920x1200 a 2560x1600. Použité množstvo teselácie normal a extreme.
Alien vs Predator
Pre odtestovanie tejto hry používam voľne dostupný benchmark vo verzii 1.3, na ktorého spustenie nie je nutná nainštalovaná hra. Benchmark je na rozdiel od hry určený výlučne pre Direct3D 11 kompatibilný hardware. Tak ako hra je postavený na engine Asura a pre majiteľov D3D 11 kariet umožňuje použitie MSAA (4x), teselácie a Advance Shadow. Okrem iného hra podporuje aj technológiu Eyefinity od AMD. Priebeh benchmark scény je zaznámenávaný po dobu 100s pomocou programu FRAPS.
Anno 1404
Anno 1404 je realtime stratégia postavená na engine R3Dengine2, ktorý hre umožňuje využívať výhody Direct3D 10 a podporu viacjadrových procesorov. Okrem efektov ako Depth of Field, je hra po stránke FPS s novším štandardom o poznanie plynulejšia. Pri testovaní bola použitá scéna Cathedral city, známa z predchádzajúcich testov. 20s priebeh, počas ktorého je budovaná katedrála, je zaznamenávaný programom FRAPS. Počas neho boli všetky detaily na maxime, okrem vypnutého TAA.
Battlefield: Bad Company 2
Dice s vylepšeným enginom Frosbite 1.5 priniesla do druhého dielu Bad Company okrem vylepšenia vizuálnej stránky (HBAO, Depth of Field, soft particles) vynovený deštrukčný model pod názvom Destruction 2.0. Ten je postavený na fyzikálnom engine Havok a v hre umožňuje zničiť obrovské množstvo detailov. Vývojári nezabudli na podporu Eyefinity od AMD. V teste je použitá jedna z najnáročnejších scén singleplayer časti s masívnymi explóziami, misia Crack The Sky. Priebeh zaznamenáva program FRAPS počas 60s akcie.
Call of Duty: Black Ops
Na novom pokračovaní Call of Duty pracovalo štúdio Treyarch, ktoré aj napriek starému enginu známeho z predchádzajúcej verzii World at War a mnohým kritikám, zaznamenalo obrovský úspech v predaji titulu Black Ops. Hra používa vylepšenú verziu enginu IW 3.0. Pre testovanie hry bola použitá predscriptovaná misia s názvom S.O.G, počas ktorej je priebeh po dobu 45s zaznamenávaný programom FRAPS.
Colin McRae: Dirt 2
Závodná hra Dirt 2 od Codemasters beží na Ego Engine, ktorý podporuje aj najnovší Direct3D 11. Hra ako prvá zahŕňala podporu tohto štandardu. Reálnosť hry dotvára hardvérová teselácia vody, publika a vlajok, HDAO využívajúce DirectCompute, HDR osvetlenie, motion blur, Depth of Field a mnoho ďalších efektov. Testy prebiehali po dobu 60s v náročnej mape Malaysia.
Crysis Warhead
Príbeh z Crysis Warhead sa odohráva paralelne k dielu Crysis a je postavený na rovnakom Cryengine 2. V kampani sa dostane do roli bývalého člena SAS Delta Force Michaela Sykes-a, pod prezývkou Psycho. Počas nej bojujete proti nepriateľom zo Severnej Kórei a mimozemšťanom. Dej sa odohráva na rôznych miestach, ako napríklad džungľa, podzemný komplex, letisko a mnoho ďalších. Hra je aj napriek svojmu veku jedna z najnáročnejších vôbec. Testovanie prebiehalo v náročnej scéne From Hell’s Heart po dobu 30s.
Just Cause 2
Pc verzia Just Cause 2 je založená na Avalanche Engine 2.0 a zahŕňa podporu len pre Direct3D 10. V hre sa dostanete na vymyslený ostrov Panau v juhovýchodnej Ázii, kde máte ako Rico Rodriguez za úlohu zvrhnúť diktatúru. Po stránke efektov je v hre implementované SSAO, soft shadows či motion blur. Majitelia nVidia kariet si okrem nich môžu vychutnať CUDA efekty v podobe krajších detailov vody alebo Bokeh filtra. Tie boli pri testovaní vypnuté. Testovaný úsek Chaos v kasíne je zaznamenaný FRAPSom počas 25s behu.
Mass Effect 2
Druhé pokračovanie akčnej hry Mass Effect využíva modifikovanú verziu Unreal Engine 3 použitého už v prvej časti. Vylepšenia nastali hlavne v technikách osvetlenia a kvalitnejších textúr. Hlavnou postavou príbehu je veliteľ Shepard, ktorý sa s organizáciou Cerberus snaží zachrániť ľudstvo. Pre testovanie výkonu grafických kariet je použitá save pozícia na planéte Aeia. FRAPS zaznamenáva priebeh po dobu 25s behu. Konfiguračný súbor hry je doplnený o riadky: "SmoothFramerate=False" und "UseVsync=False".
Metro 2033
Hra Metro 2033 je vytvorená podľa sci-fi románu ruského autora. Je založená na vlastnom engine od 4A. Svojou pokročilou grafikou v podobe viacerých efektov (Depth of Field, teselácia, SSAO, motion blur, soft shadows a mnoho iných) s kombináciou PhysX fyzikálneho enginu "predbehla" dobu. V hre Metro ste postavený do role Artyom-a, ktorý prežil atómovú vojnu a žije v podzemí. Jeho úlohou je dostať sa do mesta Polis. Testovanie prebieha počas útokov mutantov v misii Cursed, priebeh zaznamenáva FRAPS po dobu 30s.
S.T.A.L.K.E.R. Call of Pripyat
Dej tretieho pokračovania akčnej FPS hry od ukrajinského GSC Game World sa odohráva krátko po Shadow of Chernobyl. Hra beží na X-Ray engine 1.6, v ktorom je doplnená podpora o Direct3D 11 (teselácia a vylepšené tiene). Pre fotorealistickú grafiku okrem nich využíva napríklad SSAO, HBAO, Depth of Field(viac tu). Testovacia scéna z mesta Pripyat je zaznamenávaná FRAPSom po dobu 30s behu.
Spotreba, hlučnosť a teploty
Spotreba
Meranie spotreby prebiehalo s pomocou meracieho prístroja Voltcraft Energy Monitor 3000 v troch druhoch prevádzky. Najprv bola zmeraná spotreba celej zostavy (bez monitora) v režime bez záťaže (2D), 10minút po nabootovaní operačného systému Windows 7 64bit so zapnutou Aero plochou. Následne prebehlo meranie 3D spotreby v testovanej scéne hre Crysis pri rozlíšení 1920x1200 s 4xMSAA/16xAF. Posledné meranie prebiehalo po dobu 15minút v programe Furmark. Testovanie bolo v rozlíšení 1280x1024 1xMSAA, 1xAF a Xtreme Burning Mod. Táto hodnota predstavuje tzv. "worst case" hodnotu, maximálne vyťaženie grafickej karty.
Namerané hodnoty predstavujú príkon celej zostavy bez monitora, preto je možné že vznikli menšie nepresnosti kvôli účinnosti zdroja, ktorá nie je pre každé zaťaženie rovnaká.
Najnižšiu spotrebu v 2D mala OC verzia GTX 460 (0.875V) od Asusu. GTX 460 SOC od Gigabyte mala kvôli komplexnejšiemu PCB pri totožnom 2D napätí a frekvenciách o niečo vyššiu spotrebu. Podobná situácia bola aj pri GTX 470 SOC vs referenčná GTX 470, obe s napätím 0.875V. Rozdiel medzi GTX 460 DirectCU TOP a SOC verziou sa v 3D a Furmarku zvýšil pravdepodobne aj kvôli rozdielným napätiam (Asus - 1.012V, Gigabyte - 1.025V). Spotreba GTX 470 SOC bola v 3D a Furmarku pravdepodobne ovlypnená aj vyššími teplotami. Testovaný kus mal problém s uchladením karty vo Furmarku, teploty boli oproti zahraničným recenziám nezvyčajne vysoké. Karta v predaji by týmto problémom nemala trpieť.
Hlučnosť
Meranie hlučnosti grafických kariet s pomocou hlukomeru Voltcraft SL-100 prebiehalo v rovnakých režimoch ako to bolo pri meraní spotreby. Teda 2D režim 10minút po nabootovaní systému, 3D počas hry Crysis a 15minút vo Furmarku. Vo všetkých prípadoch boli vypnuté nainštalované ventilátory v skrini. Zdrojom hluku bol disk, zdroj Enermax Infinity 650W so zregulovanou Noctuou P12-1300 na 750rpm a tiež zregulovaný CPU chladič NH-U12P s jedným ventilátorom P12-1300. Meranie bolo uskutočnené 20cm od skrinky SilverStone FT02B-W s otvorenou bočnicou.
V režime 2D je najtichšia GTX 470 SOC, za ňou nasledujú obe nereferenčné GTX 460. Chladič oboch testovaných GTX 460 by mohol bežať na podstatne nižších otáčkach, keďže teplota karty od Asusu bola v idle pri 25% rpm len 30°C a karty od Gigabyte pri 40% rpm dokonca len 29°C. V 3D je najtichšie chladenie WindForce od Gigabyte, obe SOC verzie vytvárajú len minimálny hluk. DirectCU od Asusu patrí tiež k jedným z najtichších doteraz testovaných riešení.
Teploty
Meranie teplôt naväzuje na meranie spotreby, počas troch testov (2D, 3D - Crysis, Furmark) sú teploty pre jadro grafických kariet odčítavané v programe GPU-Z a MSI Afterburner. Pre zvyšné teploty (pamäte a napäťové regulátory) bolo nutné otvoriť bočnicu skrinky FT02B-W. Pre toto meranie bol použitý laserový teplomer Voltcraft IR-280.
Grafické karty: | Sapphire Radeon HD 6850 Toxic | Gigabyte Radeon HD 6870 | Asus GeForce GTX 460 DirectCU TOP | Gigabyte GeForce GTX 460 SOC | Asus GeForce GTX 470 | Gigabyte GeForce GTX 470 SOC |
jadro 2D | 42°C | 41°C | 30°C | 29°C | 43°C | 41°C |
jadro 3D Crysis | 75°C | 77°C | 60°C | 63°C | 86°C | 83°C |
jadro 3D FurMark | 83°C | 86°C | 73°C | 80°C | 91°C | - |
pamäť 2D | 41,7°C | 40.2°C | 39,3°C | 35.2°C | 40,4°C | 46.5°C |
pamäť 3D Crysis | 70,6°C | 70.2°C | 73,4°C | 72.8°C | 73,2°C | 83.4°C |
pamäť 3D FurMark | 74,8°C | 75,5°C | 96,1°C | 91.8°C | 83,3°C | - |
nap. regulátory 2D | 45,7°C | 40,9°C | 45,5°C | 40.5°C | 39,7°C | 57.8°C |
nap. regulátory 3D Crysis | 67.2°C | 70,4°C | 75,2°C | 83°C | 59,8°C | 89.6°C |
nap. regulátory 3D FurMark | 75,4°C | 74,4°C | 104,7°C | 90.3°C | 89,9°C | - |
V tabuľke nenájdete teploty pre GTX 470 Super Overclock vo Furmarku kvôli problému testovaného kusu.
Asus GTX 460 DirectCU TOP
Gigabyte GTX 460 Super Overclock
Gigabyte GTX 470 Super overclock
Pretaktovanie, výkon po OC
Pretaktovanie je celkom obľúbený spôsob ako zvýšiť výkon nielen grafických kariet. Z veľkej časti je ale OC o šťastí, lebo nie všetky jadrá majú rovnaký taktovací potenciál. Preto naše výsledky nemožno zovšeobecňovať, rozdiely by ale nemali byť veľké. Aby sme minimalizovali vplyv chladenia na výsledok, otáčky ventilátora boli u každej z kariet nastavené fixne na 100%rpm. Zmena frekvencií a napätia je realizovaná v programe MSI Afterburner. Stabilitu frekvencií sme preverili v štyroch programoch. Najprv bolo nájdené maximum pre jadro pomocou testu Furmark. Ak test prešiel po dobu 10minút bez artefaktov, nasledovali testy v Unigine Heaven, 3DMark 11 a nakoniec v hre Crysis. Obdobným spôsobom sme našli maximum pre pamäte. Všetky karty sme otestovali pri štandardnom a zvýšenom napätí. Pri zvýšení napätia netreba zabúdať na zvýšené požiadavky na zdroj a chladenia.
Asus GTX 460 DirectCU TOP
GeForce GTX 460 od Asusu s názvom DirectCU TOP je pretaktovaná od výroby o 100MHz na jadre, 200MHz shader core a 100MHz na pamätiach. Pri štandardnom napätí bola karta stabilná pri frekvenciách 870/1740/1075MHz pre jadro/shader core/pamäte. V konečnom výsledku to činí navýšenie frekvencií o 12% na jadre/shader core a takmer 8% na pamätiach.
Po zdvihnutí napätia sa stabilný takt jadra, shader core a pamätí zvýšil na 900/1800/1075MHz, čo je oproti referenčným 675/1350/900MHz výborný výsledok.
Gigabyte GTX 460 Super Overclock
SOC verzia GTX 460 od Gigabyte má už v základe veľmi vysoké pracovné frekvencie 815/1630/1000MHz. Pri štandardnom napätí sa mi ich podarilo zvýšiť na hodnotu 870/1740/1100MHz. V prípade jadra/shader core sa jednalo o 7% nárast a pamätí o 11%. V oboch prípadoch sa potvrdili skvelé OC možnosti jadra GF104. Rozdiel medzi pretaktovaním pamätí bol spôsobený lepšími osadenými modulmi u karty Gigabyte.
Gigabyte GTX 470 Super Overclock
Druhá SOC karta od Gigabyte GTX 470 má oproti referenčnej verzii tiež vysoké pracovné frekvencie 700/1400/837MHz. Kartu sa mi podarilo pri štandardnom napätí pretaktovať na 790/1580/950MHz. Nárast frekvencií oproti pracovným bol v prípade jadra, shader core o 13% a u pamätí takmer 14%. Jedná sa dokonca o najvyšší nárast z dnes testovaných kariet. Oproti referenčným taktom GTX 470 bolo jadro a shader core pretaktované až o 30%!
Karta by bola schopná po zdvihnutí napätia bežať aj na vyšších frekvenciách, ale kvôli problémom tohto testovaného kusu s chladením nebolo možné otestovať jej stabilitu.
Výkon po pretaktovaní
Pre otestovanie výkonu som použil dva syntetické benchmarky (3DMark 11, Unigine Heaven) a jednu hru (Crysis), ktoré boli použité pri testoch stability. Ako sa prejavili jednotlivé OC výsledky na výkon testovaných kariet môžete vidieť v grafoch.
Zhrnutie výsledkov, záver
Výkon
Do celkového hodnotenia sme brali do úvahy len testy z 10hier prerátané individuálne na percentá. 100% výkonu reprezentuje karta s najvyššími percentuálnymi ziskami z predchádzajúcej recenzie.
Pretaktované verzie GTX 460 od Gigabyte a Asusu sa výkonovo vyrovnali konkurenčnej HD 6870 a pri použitom 4xMSAA ju dokonca prekonávajú. V hrách, kde je pre GF100 limit v textúrovacích jednotkách, majú navrch vďaka vyšším frekvenciám aj nad referenčnou verziou GTX 470. Opačná situácia je v hrách závislých na shader core a na geometrii, v nich je GF104 slabšie aj v podaní OC verzií. Gigabyte GTX 460 Super Overclock je od referenčného modelu rýchlejšia v priemere o 17% a Asus GTX 460 DirectCU o 13%.
Super Overclock verzia GTX 470 od Gigabyte je od referenčného modelu rýchlejšia v každom rozlíšení v priemere o 8 až 10%. Okrem lepšieho geometrického výkonu oproti konkurencii (vrátane GF104) karta ťaží aj v situáciach limitovaných veľkosťou VRAM.
Prevádzkové vlastnosti
Spotreba v Idle je medzi GF104 verziami v mierny prospech pre GTX 460 DirectCU TOP. Táto karta má najnižšiu spotrebu zo všetkých testovaných. Spotreba u GTX 470 nepatrí k jej najlepším vlastnostiam. V záťaži dominujú výkonostne podobné karty od AMD. Je možné, že sa spotreba jednotlivých kariet bude líšiť kus od kusu, rozdiel ale bude veľmi malý. Najväčšie rozdiely sú s kartami s GF100, ktoré majú obrovský rozptyl VID napätí.
Pri hlučnosti v Idle boli všetky tri karty veľmi tiché. Rýchlosti ventilátorov DirectCU a Super Overclock GTX 460 sú ale mierne preddimenzované. Otáčky ventilátorov neklesnú aj napriek nízkym teplotám. V prípade Asusu je minimum 25% a u Gigabyte 40%. V záťaži malo najprijateľnejší zvukový prejav chladenie WindForce u GTX 470 a GTX 460.
Po stránke teplôt sú na tom obe GTX 460 vynikajúco. Pri záťaži nebol problém s teplotami pri žiadnej z kariet. Jediná výtka by mohla byť vyššia teplota VRM u Asusky aj napriek nainštalovanému pasívu. Problém GTX 470 Super Overclock s uchladením aplikácie Furmark pripisujem chybe testovaného kusu.
Pomer výkon/cena
Pre výpočet pomeru výkon/cena používam priemerné ceny z Heureka.sk, Tichepc.sk, Agem.sk, Alza.sk. Použité ceny pre: Asus GTX 460 DirectCU TOP 198eur, Asus GTX 470 235eur, Gigabyte GTX 460 SOC 206eur, Gigabyte GTX 470 SOC 260eur, Gigabyte HD 6870 218eur, Sapphire HD 6850 184eur.
Asus GTX 460 DirectCU TOP a Gigabyte GTX 460 Super Overclock majú spolu s Radeonom HD 6850 Toxic zatiaľ najlepší pomer výkon/cena. Pre tieto GTX 460 hovoria lepšie teploty, ale hlavne ich tichšia prevádzka pri hraní. Ako mínus týchto nereferenčných kariet vidím v ich väčšej spotrebe počas záťaže a pre niekoho môže byť problém aj dĺžka kariet, ktorá oproti referenčnej verzii narástla.
Aj keď sa GTX 470 už pomaly vytráca z obchodov stále ma svojími prednosťami čo povedať. Na jednej strane sú skvelé OC možnosti, väčšia kapacita Vram, kvalitnejšie AF ako má AMD, no na druhej je jej obrovská spotreba, teploty a hlučnosť. Gigabyte GTX 470 Super Overclock odstránila svojím nereferenčným chladením WindForce 3X problém s hlučnosťou a čiastočne aj s teplotami. Spolu s kartou GTX 460 z rovnakej série s chladením WindForce 2X patria k najtichším testovaným riešeniam.
Zhrnutie kladov a záporov testovaných kariet
Asus GeForce GTX 460 DirectCU TOP | |
Plusy | Mínusy |
- výkon - nízka spotreba v režime 2D - OC potenciál - relatívne tichá v režime 3D - kvalitnejšie AF ako konkurencia - CUDA, 3D Vision | - dĺžka karty kvôli chladiču |
Gigabyte GeForce GTX 460 Super Overclock | |
Plusy | Mínusy |
- najvýkonnejšia GeForce GTX 460 - nízka spotreba v režime 2D - OC potenciál - lepšie moduly pamätí -> vyššie OC - relatívne tichá v režime 3D - kvalitnejšie AF ako konkurencia - CUDA, 3D Vision | - vyššia spotreba kvôli mierne vyššiemu Vcore a komplexnosti PCB - dĺžka PCB |
Gigabyte GeForce GTX 470 Super Overclock | |
Plusy | Mínusy |
- výkon - OC potenciál - relatívne tichá v režime 3D - kvalitnejšie AF ako konkurencia - CUDA, 3D Vision | - vyššia spotreba kvôli mierne vyššiemu Vcore a komplexnosti PCB - dĺžka PCB |
Vďaka patrí spoločnostiam: ASUS za zapožičanie kariet GTX 460 DirectCU TOP
a GIGABYTE za zapožičanie GTX 460 Super Overclock, GTX 470 Super Overclock.
adun
yesper
mano8
crux2005
mano8
n0vIc3
Rolko 75
helevole
misog
yesper