EN

Boj o mainstream: Radeon HD 4850 (Toxic) vs. GeForce 9800 GTX (+)

V tejto recenzii sa pozrieme spolu na najnovší mainstream čip od AMD/ATi, pokračovateľa úspešného RV670, s obligátnym názvom RV770 a slabšiu z dvojice grafických kartiet, ktorá je na ňom založená – Radeon HD 4850. Nezostalo to len pri výsledkoch referenčnej karty, vďaka spoločnosti Sapphire sme mali k dispozícii Radeon HD 4850 Toxic – pretaktovanú verziu s lepším chladením. Ako protivníkov sme im postavili na štart GeForce grafické karty z podobnej cenovej a výkonnostnej kategórie. GeForce 9800 GTX a GTX+ od Gigabyte. Bývalí high-end nVidie, ktorý sa prepadol do mainstreamu. Ako dopadlo výkonnostné porovnanie? Ktorá karta sa viac oplatí kúpiť? a ešte mnoho iných otázok zodpovieme na ďalších stranách...

Úvod



nová séria, nové logo, AMD/ATi to poriadne roztočila

Poďme ale najprv do blízkej minulosti. Po mnohých odkladoch bola 14. mája predstavená Radeon HD 2900 XT, založená na R600, prvom desktop čipe od AMD/ATi s podporou Direct3D 10. Podrobná recenzia na PC.sk: R600 pod drobnohľadom. Možno povedať, že R600 bol nadčasový, až tak nadčasový, že neponúkal to, čo hry danej doby potrebovali a súčasné ešte stále (v pomere samozrejme) potrebujú. Bola to jasná chyba ATi, lebo zle odhadla potreby hier/vývojárov a skonštruovala čip až veľmi zameraný na FP-16 výkon, ktoré sa v hrách používa a (podľa viacerých vývojárov) bude používať len minimálne. V celkovom meradle by to pre AMD/ATi neznamenalo taký neúspech, bola tu ale silná konkurencia v podobe G80, predstavená ešte v novembri 2006. Verejná mienka o R600 bola preto na bode mrazu aj keď po technickej stránke nebol čip až taký zlý.


referenčná AMD/ATi Radeon HD 4850, pri prvom pohľade na nerozoznanie od HD 3850

AMD/ATi si uvedomovala, že v priebehu 6 mesiacoch, čo je ich vývojový cyklus nových čipov, nedokáže uskutočniť radikálne zmeny na architektúre. Problémy sa ale mali aspoň čiastočne riešiť. Spravilo sa teda to, čo bolo v tom krátkom čase možné – die shrink R600. Pre spoločnosť to znamenalo aj ďalší podstatný fakt. Veľmi veľké a v konečnom dôsledku drahé jadro R600 sa zmenšilo vďaka 55nm procesu u TSMC na viac ako polovičku. Nové jadro dostalo názov RV670 a spolu s ním bola vydaná aj nová generácia grafických kariet Radeon HD 3000, venovali sme sa im v článku: AMD/ATi Radeon HD 3870 (CrossFire). Tie mohli vďaka výrobnému procesu pracovať s vyššími frekvenciami a podávať spolu s malými zmenami vyšší výkon. Pridaná bola aj podpora Direct3D 10.1, UVD+ a PowerPlay. Celkový balík bol už konkurencieschopný a preto si AMD/ATi vydobyla späť podiel na desktop trhu. Ďalším pozitívom výrobného procesu bolo, že AMD/ATi mohla ponúkať pomerne lacno grafické karty založené na RV670 a postaviť dvojčipové riešenie HD 3870X2. Táto nová stratégia malých performance jadier, dvojčipových riešení, ktorá sa zdala byť najlepšou cestou, padla po neúspechu s veľkým R600 a finančnými problémami. Až neskôr vysvitlo, že práve RV670 bol bod zlomu pre AMD/ATi, lebo konkurencia zle odhadla jeho výkon.


referenčná nVidia GeForce 9800 GTX alebo GTX+, navonok sú si identické

Chystaný RV770 mal mať už odstránené nedostatky R600 a ďalej pokračovať v novej stratégii. Pred jeho oficiálnym vydaním kolovalo neskutočne veľa verzií rôznych špekulácií, ako by mohol čip vyzerať. Najzaujímavejšie na tom bolo, že skoro všetky boli nesprávne. Samozrejme, tieto informácie rozširovala AMD/ATi naschvál, aby nemali ľudia veľké očakávania. Potom malo prísť veľké prekvapenie, ktoré len málokto čakal. Toto je veľmi podstatný fakt, ktorý si mnohí možno ani neuvedomujú. Pokiaľ by sme sa pozreli do minulosti, presne takýto okamih prekvapenia mali všetky „legendárne čipy“. Keď som písal preview o G200, tak som aj okrajovo spomenul, že "Na rozdiel od G200, neboli zatiaľ (podľa mojich vedomostí) o AMD/ATi čipe RV770 zverejnené na internete skoro žiadne pravdivé informácie". Všetko to súvisí s vývojom RV770, ktorý trval zhruba 30 mesiacov a prešiel mnohými etapami. Počas nich sa viaceré špecifikácie pomerne rýchlo menili. Keď teda niekto niečo, v danej dobe pravdivé, zverejnil, mohlo to byť už krátko na to nepravdivé.


asi len málokto čakal 800 SPs a aritmetický výkon 1 TFlops/s

Oficiálne padlo NDA (zmluva o mlčanlivosti) na RV770 a novú grafickú kartu Radeon HD 4850 o niečo skôr ako bolo naplánované – 19. júna 2008, nie ale na všetko, len na jej výkon. Kto mal záujem vedieť aj niečo o architektúre, musel čakať do 25. júna, teda jeden týždeň. Dôvod bol prostý, Radeon HD 4850 bolo možné už dlhšie pred oficiálnym uvedením zakúpiť. Čip RV770 tvorí teda základ novej Radeon HD 4800 série, momentálne pozostávajúcej z Radeon HD 4850, 4870 a 4870 X2. Výkonnostné rozdiely sú dosiahnuté len rôznymi pracovnými frekvenciami jadra, pamäti v prípade HD 4850 a 4870. Radeon HD 4870 X2 predstavuje dvojčipové riešenie, ktoré má technické parametre zhodné s dvoma HD 4870 a väčšiu, 2GiB VRAM. V poslednej chvíli zareagovala na uvedenie HD 4850 aj nVidia. Predstavila GeForce 9800 GTX+, pretaktovanú verziu 9800 GTX, ktorá má byť konkurenciou pre Radeon HD 4850. Zároveň bola znížená cena samotnej GeForce 9800 GTX.


RV670 bol len začiatok...

Po dlhom uvažovaní sme sa rozhodli, že aj my budeme podobne postupovať. V dnešnej recenzii si predstavíme Radeon HD 4850 a jej konkurenciu, v blízkej budúcnosti bude nasledovať recenzia Radeon HD 4870 s jej priamou konkurenciou. Keďže venujeme veľkú časť recenzie výkonu novej karty, rozhodli sme sa, že do veľkej miery zmeníme doteraz zaužívané testy a nastavenia. Mnohé hry vypadli, lebo ich testy mali malú výpovednú hodnotu, alebo boli jednoducho málo náročné. Nahradili sme ich novšími a náročnejšími testami. Aby sme odbremenili CPU a sústredili sa na zaťaženie GPU, testovali sme v rozlíšeniach 1280x1024 a 1600x1200. Budúce testy môžme vďaka spoločnosti Samsung, ktorá nám vypožičala na testovanie 26“ LCD monitor SyncMaster 2693HM, uskutočniť aj v rozlíšení 1920x1200. Toto rozlíšenie sme v dnešnej recenzii zámerne vynechali, lebo nepatrí medzi mainstream. Čo sme ale vždy zapli bolo vyhladzovanie hrán, konkrétne 4xMSAA , 8xMSAA a 16x anizotropný filter. Dnešné mainstream grafické karty majú dostatočné výkonnostné rezervy aby sme mohli zapnúť vyhladzovanie hrán a anizotropný filter, tak prečo ich nevyužiť? Okrem toho sa stávajú tieto features pomaly bežnými.


naše dve testované grafické karty - Sapphire HD 4850 Toxic a Gigabyte GeForce 9800 GTX

Poďme si teraz komplexne rozobrať čip RV770 a krátko aj G92. Následne sa pozrieme na naše testované grafické karty. Pre väčšie množstvo výsledkov sme podtaktovaním, respektíve pretaktovaním simulovali ďalšie dve karty. V jednotlivých grafoch výkonu máme preto až 4 výsledky – Sapphire Radeon HD 4850, 4850 Toxic, Gigabyte GeFoce 9800 GTX a GTX+.



Čip RV770 a G92

55nm jadro RV770 bez chladiča vo flipchip vyhotovení

RV770 je názov najnovšieho mainstream, alebo keď chceme, performacne čipu od AMD graphics product group. Jeho vývoj trval, ako som písal, 30mesiacov, čo je dva a pol roka. Možno vám meno šéfinžiniera projektu – Scott Hartog nič nehovorí. Napriek tomu to nie je žiaden nováčik v branži. Pracoval už pre Real3D, Intel a ešte samostatnú ATi. Skúsenosti a schopnosti preto rozhodne má. Netypické je ale, že na projekte „RV770“ pracovalo dokopy 6 tímov, ktoré boli roztrúsené po celom svete. Ich cieľom bolo narvrhnúť čip, ktorý je síce založený na R600/RV670, ale má odstránené ich nedostatky a oveľa vyššiu efektivitu. Na docielenie toho museli inžinieri postupne zmenšiť veľkosť jednotlivých logických blokov, bez toho, aby obemdzili ich funkčnosť. Vďaka tomu mohli zvýšiť počet jednotlivých jednotiek a logicky aj teoretický maximálny výkon. Zároveň ale mali na pamäti, aby dokázalo GPU lepšie využiť väčší počet výpočtových jednotiek.


65nm jadro G92-420-A2 bez chladiča vo flipchip vyhotovení, A2 značí revíziu, náš kus bol vyrobený v 9. týždni 2008, teda v máji

Podobne ako RV670 aj RV770 je vyrábaný u TSMC v 55nm procese a má okolo 965 miliónov tranzistorov. Celková plocha jadra je 260mm^2, čo nám dáva ~ 16mm dĺžku jednotlivých strán. Naše vlastné meranie to potvrdzuje. Oproti RV670 sa teda veľkosť jadra zväčšila, nie ale o toľko, ako by sme mohli podľa počtu jednotiek očakávať. Pripomeniem ešte, že RV670 má 666 miliónov tranzistorov v ~ 193mm veľkom jadre. Oproti obrovi s názvom G200 je to menej ako polovička. V tomto prípade je ale podstatné porovnanie s priamou konkurenciou v mainstreame – G92. Tento 65nm čip so 754 miliónmi tranzistorov sa nachádza na viacerých kartách, počnúc GeForce 8800 GT až po 9800 GTX(+). Jeho veľkosť je okolo 324mm^2, zhruba 18mm na jednu stranu. G92b, ktorý predstavuje len die shrink G92 na 55nm, je logicky menší. Má identickú veľkosť ako RV770, zhruba 260mm^2 a rovnaký počet tranzistorov ako G92. G92b sa nachádza momentálne len na GeForce 9800 GTX+, žiaľ niektoré modely sú vybavené G92. Takto docielila nVidia vypredanie zvyškových zásob G92. Pri priamom porovnaní G92b a RV770 je nápadný hlavne rozdiel v počte tranzistorov. Nemožno to však prebrať 1:1, lebo nVidia počíta mierne inak tranzistory ako AMD/ATi.

Technické parametre čipu RV770
Výrobný proces:
55nm @ TSMC
Počet tranzistorov: ~956 miliónov
Plocha a rozmery jadra: ~256mm^2; ~16mm x 16mm
Obal jadra: flipchip
Základná konfigurácia: 40 textúr/ 16 pixelov/ 64x Z
Zbernica: 256-bit
4x 64-bit
Podpora Direct3D: 10.1
Pripojenie k systému: PCI-Express 2.0 x16
Výstupy: 2x dual-link DVI, HDMI, HDCP
Technické parametre čipu G92
Výrobný proces:
65nm @ TSMC
Počet tranzistorov: ~754 miliónov
Plocha a rozmery jadra: ~325mm^2; ~18mm x 18mm
Obal jadra: flipchip
Základná konfigurácia: 64 textúr/ 16 pixelov/ 64x Z
Zbernica: 256-bit
4x 64-bit
Podpora Direct3D: 10
Pripojenie k systému: PCI-Express 2.0 x16
Výstupy: 2x dual-link DVI, HDMI, HDCP


Wafer s jadrami RV770 pod mikroskopom vyzerá nasledovne:

klikni pre zväčšenie

Keď zvýrazníme jednotlivé logické bloky, dostaneme niečo takéto:

klikni pre zväčšenie

Memory interface (pamäťové pripojenie) obopína veľkú časť čipu, ktorá je tvorená prevažne SIMD cores (shader core, riadiace jednotky, pamäte cache) a Texture Units (texturovacie jednotky), nachádzajúcich sa zhruba v strede.

Pozrime sa teraz na zjednodušenú schému jadra RV770, ktorá sa zdá byť podobná R600 a RV670. V skutočnosti sú tu ale veľké rozdiely.


klikni pre zväčšenie

Niektoré časti sa nedajú dobre rozoznať, lebo sú príliš malé. Preto sa na ne teraz pozrieme detailnejšie. Celkovo obsahuje jadro 10 SIMD cores ako ich označuje AMD/ATi alebo clusterov. Každý SIMD core obsahuje 16 stream processing jednotiek, ktoré predstavujú superskalárne bloky po 5 ALUs. Tieto poznáme už z R600 a oproti nim sa zmenili len mierne – „tlstá“ ALU dokáže naďalej oproti štyrom „chudším“ viac, napr. špeciálne funkcie (SFUs). Keď si to chceme vyjadriť číselne, tak podľa toho ako počítame, dostaneme buď 800 alebo 160 Vec5 aritmeticko-logických jednotiek. AMD/ATi ich označuje ako 800 SPs (stream processors). To je naozaj veľa ALUs. Presne 2,5x viac ako má RV670 alebo R600. V prípade Radeon HD 4850 predstavuje RV770 prvé GPU s aritmetickým výkonom 1 TFlops/s. Radeon HD 4870 dosahuje vďaka vyššej pracovej frekvencii až 1,2 TFlop/s. V oboch prípadoch je to viacej ako má G200 na grafickej karte GTX 280. Netrebe ale zabudnúť, že Flops/s sa nerovnajú Flops/s na inej architektúre. Priamo porovnávať sa tieto teoretické hodnoty preto nedajú.


klikni pre zväčšenie

AMD/ATi sa podarilo mierne rozšíriť funkčnosť ALUs a čo je najpodstatnejšie, zmenšiť plochu, ktorú zaberajú na jadre, bez toho, aby bol zmenený výrobný proces. Scott Hartog hovorí pri týchto jednotkách o 40% náraste výkonu na 1mm^2. Pôvodne bolo naplánované, že RV770 bude mať 8 clusterov. Po tom, ako dokončili inžinieri prácu na stream processors, sa ale zistilo, že by v návrhu zostalo voľné miesto. Pamäťové pripojenie, ktoré sa nachádza na okraju jadra určuje jeho potrebnú veľkosť a 8 clusterov by nevyplnilo všetok priestor. Bolo teda nutné pridať ďalšie dva SIMD cores, čim sa zvýšil počet ALUs na 800 a arimtetický výkon na 1 TFlops/s.


klikni pre zväčšenie

Väčšina nových schopností SPs je určená pre GP-GPU segment. Preto dostal každý SIMD core 16KB veľkú lokálnu zdielanú pamäť (local data shader), aby si mohol rýchlo zdielať dáta medzi jednotlivými threads. Podobnú 16KB pamäť integrovala aj nVidia do SMs v G200. Táto pamäť nie je dostupná programátorom cez Direct3D API, ale AMD/ATi ju môže využiť pre väčšie kernely custom AA filtrov alebo iný druh postprocessingu. RV770 má "novú" 16KB veľkú, globálne zdielanú pamäť (global data share), cez ktorú môžu SIMD core komunikovať s iným. Už hotové dáta si teda SIMD cores môžu medzi sebou zdielať, bez toho, aby musel iný SIMD core znovu to isté počítať.

Okrem toho bola štyrom „chudším“ SPs pridaná schopnosť, ktorú mala na RV670 len „tlstá“. Je ňou schopnosť vykonávať integer bit-shift operácie. Tie môžu pomôcť pri akcelerácii videa, enkódovaní a kompresii. Vývojoví tím pridal aj viaceré import a export schopnosti, aby boli umožnené „scatter“ (deliace) a „gather“ (zhromažďovacie) operácie s plnou rýchlosťou. Nemôžem nespomenúť ešte jednu zaujímavú schopnosť ALUs, ktorou je možnosť vytvárať tzv. „lightweight“ (ľahké) thready pre GP-GPU aplikácie. Thready pre grafické aplikácie mávajú veľa hodnôt spojených s ich pozíciou. Pri GP-GPU aplikáciách to ale nie je potrebné a preto bol RV770 optimalizovaný, aby dokázal takéto jednoduchšie thready rýchlo vytvoriť.

Zachovaná bola aj podpora double precision v ALUs, ktorá sa zatiaľ využíva jedine v GP-GPU aplikáciách. Platí to, čo som písal v článku o RV670 – celkový double precision výkon RV770 je rovný 1/5 maximálneho single precision aritmetického výkonu (1TFlops/s). Už Radeon HD 4850 je preto v tejto oblasti so svojimi 200GFlops/s výkonnejšia ako každé high-end CPU alebo GTX280, ktorá ponúka síce 78 GFlops/s DP aritmetický výkon, ale aj so (DP) špeciálnymi funkciami.

Väčšina týchto zmien neprinesie zvýšenie výkonu v grafických aplikáciách, ďalšia ale môže. Pred vydaním prvej Direct3D 10 generácie písala AMD/ATi a nVidia vývojárom hier, aby nepoužívali tak výrazne geometry shadery, keďže ich čipy nie sú ešte také výkonné v tejto oblasti a inžinieri majú zatiaľ len málo skúseností ako riešiť danú problematiku. Ďalšími generáciami sa to malo vylepšíť. AMD/ATi a nVidia preto pracovali na vylepšení geometry shader výkonu na ich čipoch. V G200 bola zvýšená výrazne veľkosť pamätí určených pre GS. AMD/ATi síce tvrdila, že ich GPU je v tomto ohľade lepšie na tom ako konkurencia, RV770 bol napriek tomu vylepšený pre situácie, keď geometry shader uschováva údaje na čipe. Oproti predchodcovi má RV770 aj mierne vylepšený teselátor, ktorý je teraz výkonnejší.

Texturovacie jednotky (modré bloky) sa stali súčasťou SIMD cores a nachádzajú sa na ich pravom konci. Obdobne je to aj v prípade G8x/G9x a G200 architektúry. Pridaním clusterov sa zvýši nielen aritmetický výkon (počet ALUs) ale aj počet TMUs, teda texturovací výkon. Vďaka tomu sa vždy zachová konštantný pomer ALUs:TEX = 4:1 (16 Vec5 ALUs má pridelené 4 texturovacie jednotky) Zaujímavé je, že RV770 má tento pomer rovnaký ako R600/RV670. Hartog zmienil až 70% nárast výkonu na 1mm^2 pre tieto jednotky. Dokopy má RV770 desať texturovacích jednotiek, schopné adresovať a bilineárne filtrovať 40 texels za takt. Oproti 16 texels za takt na RV670 je to výrazné navýšenie. Texturovacie jednotky RV770 sú ale jednoduchšie ako tie ktoré poznáme z RV670, lebo boli odstránené schopnosti, sub-jednotky, ktoré sa v praxi nevyužívali a zaberali jedine tranzistory. Napríklad schopnosť filtrovať FP-16 textúry v jednom takte bola odstránená, vďaka čomu sa ušetrilo množstvo tranzistorov. Znížený bol aj počet texture samplers z 20 na 16 v jednej texturovacej jednotke. Podobne ako čipy od nVidie, dokáže RV770 filtrovať textúry v FP-16 formáte len s polovičným výkonom. Teoretický texelfillrate pre FP-16 je preto pri rovnakej frekvencii len 1,25x vyšší ako na RV670. Tá ale nie je taká podstaná, keďže využíva len málo grafických aplikácií FP-16 filtráciu. Ako príklad uvediem Serious Sam 2 alebo 3DMark 2006. Napriek vyššej texelfillrate a lepším TMUs nebola kvalita anizotropného filtra zvýšená. Je naďalej na úrovni R600 a tým sa šetrí v priemere ~10% výkonu. Hlavne pri ostrých textúrach, ktoré majú tendenciu k shimmering-u, vidieť negatívny dopad do určitej miery „optimalizovaného“ AF.


klikni pre zväčšenie

Vrátim sa ale k architektúre. Aby bolo zaručené vysoké vyťaženie texturovacích jednotiek, bola prepracovaná celá texture cache. „Distributed unified cache“ v R600 nahradila L1/L2 hierarchická cachce. Každá L1 cache je pridružená k jednému SIMD core a uschováva pre neho dôležité údaje. L2 cahce je zase pridružená k jednotlivým pamäťovým radičom. Medzi sebou komunikujú cez známy Crossbar. Vertices majú svoju vlastnú „vertex cache“. Keďže má podobnú hierarchiu GeForce 8800, je vidieť, že AMD/ATi sa poučila od konkurencie.
RV770 má pridanú aj novú runtime, ktorá má oneskoriť alokáciu miesta v pamäti L1 cachce, pokiaľ nie je požiadavka na tieto dáta. Toto opatrenie má zvýšiť efektivitu využívania texture cache pamätí. Veľmi podstatná interná priepustnosť bola taktiež zdvojnásobená voči predchádzajúcej generácii. Hartog uviedol, že je to nutnosť, aby sa dal držať krok s množstvom dát, ktoré prichádzajú z GDDR 5 pamätí. L1 texture fetch má mať do 480GB/s a medzi jednotlivými L1 a L2 cache pamätami má byť priepustnosť do 384 GB/s.


klikni pre zväčšenie

Okrem pamätí cache boli uskutočnené aj ďalšie zmeny na pamäťovom subsystéme. Chválený RingBus od AMD/ATi je navždy preč. Nebol ale nahradený jednoduchým crossbarom, aj keď nové riešenie je tomu do určitej miery príbuzné. Štyri pamäťové radiče sú umiestnené relatívne v rohoch čipu a blízko nich sú časti s najväčšou potrebou priepustnosti – ROPs (render back-ends) a pamäte L2 cache. Údaje sú rozdelované pomocou tilingu, aby bol zabezpečený rýchly prísun dátom pre trojicu radič, L2 cache a lokálny pamäťový radič, nazývaný „Hub“ v ktorom sú pospájané. Ten dostáva dáta z klientov, ktoré nemajú také nároky na priepustnosť – PCI-Express, UVD2.0, CrossFireX a radiče obrazovky. Hub je svojou technológiou podobný RingBusu, predstavuje tiež distribuované riešenie, ale hlavne, má nižšiu latenciu. Celkovo hovorí AMD/ATi o 95% využití teoretickej priepustnosti, oproti RV670 to predstavuje 10% nárast.


klikni pre zväčšenie

CrossFireX sideport pripojenie, ktoré sa prvý krát objavilo na RV770 sa prakticky využíva až na R700, grafickej karte Radeon HD 4870 X2. Vďaka nej môžu dve tieto jadrá medzi sebou komunikovať a majú k dispozícii 5GB/s v oboch smeroch. Prvý čip ale nemôže naďalej využívať framebuffer druhého čipu. Viac sa budeme problematike venovať v prípadnom článku o Radeon HD 4870 X2.

Unified Video Decoder (UVD), ktorý môžme nájsť v RV670 a slúži k urýchleniu HD meteriálu v MPEG2, VC-1 a H.264 codec-u, bol v RV770 znovu prepracovaný. Kvôli tomu dostal nový názov – UVD 2.0 a podporuje teraz PiP (picture in picture) funkciu. Vymenený bol aj Realtek čip na PCB karty, vďaka čomu teraz dokáže vysielať osem kanálový zvuk v 24bit/192kHz formáte a podporuje Dolby TrueHD, Dolby Digital+, DTS HD. HDMI výstup bol taktiež prepracovaný, podporuje 1.3 štandard a vylepšená bola aj kvalita obrazu pri prehrávaní videa. GPU dokáže aplikovať na HD obraz dynamický kontrast, ktorý má zvýrazniť farby. Toto feature sa dá podľa želania v Catalyst Control Centre vypnúť.


klikni pre zväčšenie

PowerPlay, vďaka ktorému sa zníži spotreba GPU v 2D režíme, nemohol RV770 neprebrať. Je ale do určitej miery prerobené a teda lepšie. Na PCB sa nachádza špeciálny čip, ktorý monitoruje teplotu, vyťaženie GPU a tok dát cez PCI-Express zbernicu. Pokiaľ sú tieto hodnoty nízke, dokáže znížiť pracovnú frekvenciu a napätie jadra. Okrem toho sa zapne aj Clock-Gating. Efektivita PowerPlay sa mala predchodcovi v RV670 až zdvojnásobiť. Či je to realita, alebo nie si povieme v časti Hlučnosť, teploty, spotreba.


klikni pre zväčšenie

S týmito mnohými vylepšeniami a 256bit zbernicou by ale RV770 nebol schopný využiť svoj celý potenciál. Preto spolupracovala AMD spolu s DRAM výrobcami na vývoji nových, GDDR 5 pamäti, ktoré spolu s GDDR 3 a GDDR 4 pamäťový radič podporuje. GDDR 5 pamäte majú príkazovú frekvenciu len štvrtinovú oproti dátovej. To je dôvod prečo ukazujú programy na Radeon HD 4870 frekvenciu pamäte 900 MHz, dátová priepustnosť je ale 3600 MT/s. Výsledná priepustnosť grafickej karty je teda 115,2 GB/s, čo je viacej ako mala Radeon HD 2900 XT s 512bit zbernicou alebo ako má GeForce GTX 260 so 448bit zbernicou a GDDR 3 pamäťou. To ale len s najslabšími (3,6Gb/s) čipmi, AMD hovorí, že v blízkej budúcnosti budeme vidieť 5Gb/s GDDR 5 čipy a 6 Gb/s sú očakávané do konca roka. Nové slovné spojenie, ktoré sa bude v súvislosti s GDDR 5 pamäťami často používať je priepustnosť na 1 pin. Oproti predchádzajúcim verziám, majú GDDR 5 pamäte túto hodnotu výrazne zvýšenú.


klikni pre zväčšenie

Posledná výrazná zmena na RV770 oproti architektúre R600 sú prerobené ROPs alebo podľa AMD/ATi – render back-ends. Jeden z vývojových tímov mal za cieľ vylepšiť výkon čipu s anti-aliasingom a keďže je to jedna z prác RBEs, musel sa ich výkon výrazne vylepšiť. Celkovo má čipy štyri RBEs a každá jednotka je pripojená k 64bit pamäťovému pripojeniu. Dokopy nám to dáva 256bit zbernicu. Tieto parametre hovoria jasnou rečou – jedná sa o mainstream „value“ GPU. Oproti RV670 sa ROPs odlišujú v tom, že sú oveľa výkonnejšie. AMD/ATi prezentuje aj tabuľku, v ktorej porovnáva výkon ROPs RV670 a RV770. Oba čipy majú štyri takéto jednotky.




klikni pre zväčšenie

Vo väčšine prípadov sú ROPs RV770 dvakrát také výkonné ako tie, ktoré poznáme z RV670. Ak sa dostane FP-16 do hry, tak sú výkonnejšie vždy. S AA ale aj bez. Nie len to, RV770 dokáže 64 Z/stencil operácii za takt. Podľa Hartog-a je práve Z sample rate RV670 primárny dôvod jeho zlého výkonu s anti-aliasingom. To nie je všetko. Keď sme písali o architektúre R600, spomenuli sme, že shader resolve pre multisampling antialiasing je uskutočnený v shader-core a ROPs sú pravdepobone chybné v tomto ohľade. Využívala sa tzv. fastpath (rýchla cesta), ktorú má RV770 vo vynovenej forme tiež. Resolve uskutočnený v shader-core síce umožnil AMD/ATI poskytnúť custom AA filtre (Narrow-Tent, Wide-Tent a Edge-Detect), ale celkový prepad výkon R600 s AA bol príliš veľký. Preto sú vyššie uvedené čísla viac ako optimistické a čisto len teoretické maximá RV670. Skutočnosť bude pre Radeon HD 3800 ešte horšia. AMD/ATi ale potvrdila, že RV770 neuskutočňuje resolve v shader core pre štandardný MSAA. Pokiaľ teda bol nejaký problém s ROPs, tak bol teraz v RV770 odstránený. Ak sa použije custom filter AA mód, tak sa naďalej využíva shader core, ale pre box filtre (2x, 4x, 8x) sa už využívajú ROPs, tak ako v Radeon GPUs pred R600 a všetkých moderných GeForce čipoch.


klikni pre zväčšenie

Z predchádzajúcich odstavcov je jasné, že RV770 má oproti R600 a RV670 veľa zmien v architektúre. Malo by byť takisto jasné, že RV770 nie je len RV670 s väčším počtom výpočtových jednotiek. Je síce založený na R600/RV670, ale prebral od nich len tie dobré podnety a veľa nedostatkov bolo odstránených – hlavne čo sa týka fillratov. Pri porovnaní s konkurenciou možno povedať, že RV770 sa od R600 líši viac ako G200 od G80. Samozrejme, toto porovnanie nie je až také podstatné a úplne spravodlivé, keďže G200 ani nepotrebovala tak veľa zmien. V budúcnosti môžeme očakávať ďalšiu evolúciu RV770 s názvom RV870, ktorý by mal byť posledným čipom z „R600“ generácie. Neočakávam, že by priniesol také výrazné zmeny v architektúre ako dnes opisovaný čip. Zvýšený bude hlavne výkon, vďaka väčšiemu počtu výpočtových jednotiek, ktoré umožní nový 40nm proces.

G92(b) od nVidie, je starý známy čip, ktorý obsahuje osem G92 clusterov. Tieto clustery majú rovnaký počet TMUs, ALUs ako G94 clustery, ktorým sme sa venovali v recenzii: nVidia GeForce 9600GT (OC). Celkovo má preto čip 64 TMUs, 128 ALUs, 16 ROPs a 256bit zbernicu. Oproti G94 sa počet TMUs a ALUs zdvojnásobil, zbernica ale nie. Vo vysokých rozlíšeniach so zapnutým anti-aliasingom, preto môže byť priepustnosť limitujúcim faktorom. Vďaka menšiemu výrobnému procesu má G92b variant vyššie pracovné frekvencie ako G92.



Sapphire Radeon HD 4850 Toxic grafická karta


Spoločnosť Sapphire predstavuje "dvorného" výrobcu AMD/ATi grafických kariet a tak nesmie v jej portfóliu okrem referenčnej Radeon HD 4850 chýbať ani pretaktovaná verzia. Sapphire Radeon HD 4850 Toxic, ktorá k nám dorazila do redakcie, je presne takáto karta a líši sa voči ostatným hneď na prvý pohľad. Podobne ako jej predchodkyne z Toxic série má vyššie pracovné frekvencie a lepší chladič. K zákazníkovi sa grafická karta dostane zabalená v pomerne štýlovej čiernej krabici s mnohými nálepkami a nápismi, ktoré ju charakterizujú. Celkový dizajn je príbuzný s inými Sapphire krabicami. Po rozbalení sa objaví samostatná karta zabalená v protistatickom a nárazuvzdornom vrecúšku, chránená ešte dodatočne čiernou penou. Na samom spodku sa nachádza príslušenstvo, tradične bohaté pre Sapphire karty.




Okrem klasicky pribalených adaptérov: DVI-to-HDMI, DVI-to-D-Sub, S-Video-to-Composite, S-Video-to-YUV, napájania - molex-to-6Pin VGA sa v ňom nachádza aj množstvo užitočného softwaru ako Advanced Edition 3DMark Vantage, Cyberlink DVD Suite, PowerDVD s príslušnými aktivačnými kľučmi a Ruby ROM s 2 demo verziami hier, rôznymi obrázkami. Nesmie samozrejme chýbať ani inštalačné CD od Sapphire s ovládačmi Catalyst, jeden CrossFire mostík, inštalačný manuál a nálepka s logom Sapphire. Na rozdiel od iných kariet, kde sa častejšie predávajú retail verzie s osekaným príslušenstvom, si môže byť zákazník v prípade Toxic verzie istý, že dostane full retail verziu.



Momentálna cena v Slovenskej Republike sa pohybuje okolo 5700 Skk (189,20 EUR), čo je len mierne viac ako cena referenčnej Sapphire Radeon HD 4850. Za túto cenu dostanete grafickú kartu, ktorá patrí do vyššieho mainstreamu a má ponúkať veľmi dobrý pomer cena/výkon. Keďže už štandardná Radeon HD 4850 predstavuje po stránke výkonu konkurenciu pre GeForce 9800 GTX+, môžme očakávať, že OC verzia od Sapphire bude ešte o 8 až 15 % výkonnejšia. Viac si povieme v časti benchmarky, kde dáme odpoveď aj na otázku, či zodpovedá cena danému výkonu. Pozrime sa ale teraz detailnejšie na samotnú grafickú kartu.


Sapphire vsadila pri Radeon HD 4850 Toxic na štandardné PCB s referenčným napájaním a rozložením stavebných prvkov. Jediná zmena je vo farbe, ktorá je pre Radeon karty netypicky modrá. Ďalšie zmeny sú „pod kapotou“. Sapphire zvýšila napätie jadra RV770 zo štandardných 1,084 V v 3D režíme na 1,120V a pracovné frekvencie zo štandardných 625MHz (jadro) a 993MHz (pamäť VRAM) na 675/1150MHz (neskoršie verzie majú 1100MHz pamäť). Logicky stúpli aj teoretické technické parametre.

Technické parametre:
Názov grafickej karty:
Sapphire HD 4850 Toxic
Veľkosť pamäte VRAM:
512 MiB
Čip: RV770
Pracovná frekvencia jadra: 675MHz
Frekvencia shader core: 675MHz
Pracovaná frekvencia pamäte: 1150MHz
Teoretické peak hodnoty @ 675/1150 MHz
Pixel fillrate:
10 800 Mpixels/s
Texel fillrate:
27 000 Mtexels/s
Z sample rate:
43 200 Msamples/s
AA sample rate: 86 400 Msamples/s
Aritmetický výkon: 1080 GFLOPs/s
Geometry rate: 675 Mtriangles/s
Priepustnosť pamäte: 73,6 GB/s





Oproti referenčnej karte má Toxic verzia od Sapphire namontovaný starý známy dvojslotový chladič VF900 od Zalman (recenzia na pc.sk: Test high-end VGA chladičov), ktorý je prichytený na karte zo zadnej strany pomocou štyroch skrutiek. Nezakrýva ako referenčný chladič AMD/ATi celú kartu, len samotné jadro. Celomedený pasív s množstvom lamiel má osadený axiálny 1,68W ventilátor (12V; 0,14A) ZF8015ATM značky Zalman s guličkovým ložiskom, priemerom 75mm a modrými lopatkami. Pre lepší odvod tepla z jadra sa starajú dve heat-pipe trubice, ktoré sa následne stáčajú do kruhu. Na samotnom jadre bola nanesená štandardná strieborná teplovodivá pasta od neznámeho výrobcu. Princíp chladenia je zhodný s inými dvojslotovými chladičmi a pomerne rýchlo vysvetlený. Ventilátor nasáva zo skrinky vzduch, ktorý následne fúka na medený pasív. Nakoľko nemá karta dvojslotovú záslepku so štrbinami, ostáva teplý vzduch v skrinke. Pamäťové čipy a napájacie obvody majú vlastné pasívy a sú chladené len zvyškovým prúdom vzduchu. Najväčšia nevýhoda chladiča Zalman VF900, ktorej sa ešte budeme venovať v časti Hlučnosť, teploty, spotreba, je nemožnosť ho softvérovo regulovať. To znamená, že aj v 2D režíme, keď sa jadro grafickej karty podtaktuje na 500MHz a zníži napätie na 1,05V, pracuje ventilátor naďalej so 100% otáčkami, čo je okolo 1800 rpm.



Napájacie obvody na karty pomerne jednoduché, aj keď štandardná Radeon HD 4850 má TDP rovných 110W. Napriek podpore PCI-Express 2.0 je preto potrebné zapojiť 6Pin PCI-Express 1.0 prídavný VGA konektor na karte, ktorý dodá ďalších 75W. Naša pretaktovaná verzia bude mať pravdepodobne mierne vyššie TDP, presný údaj neuvádza Sapphire. Celkovo má karta dvojfázové napájanie, ktoré si dokáže poradiť aj s väčšou záťažou. GPU napäťový regulátor je založený na dvojfázovom PWM radiči uP6201 od uPI Semiconductor a štyroch Infineon OptiMOS 3 MOSFEToch na každej fáze (celkovo osem). Samostatný regulátor s uPI UP6101 radičom a dvoma MOSFETami sa stará o pamäte. V tomto ohľade sa teda nič oproti Radeon HD 3850 nezmenilo.



Na PCB karty sa nachádza dokopy 512 MiB (8 čipov po 64MiB, usporiadané do tradičného Lka) 0,83ns GDDR 3 pamäte Samsung s označením K4J52324QH-HJ08, ktoré majú pracovné napätie 2,05V a 1200MHz (reálne) rating. Na Sapphire grafickej karte sú prevádzkované s 1150 MHz, teda blízko k limitu. V spojení s 256bit externou zbernicou dostávame priepustnosť 73,6 GB/s. To je viac ako má štandardná Radeon HD 3870 s GDDR 4 pamäťou (72 GB/s). Celková dĺžka karty je 23,4 cm, skoro 4 cm menej ako má GeForce 9800GTX(+). Problémy s nedostatkom miesta v skrinke by teda nemali nastať.



Na zadnej strane karty je vyvedený jeden HDTV a dva dual-link DVI výstupy podporujúce HDCP. Nie je preto problém vysielať chránený obsah v rozlíšení 2560x1600. Balenie Sapphire HD HD 4850 Toxic obsahuje aj DVI-to-HDMI prevodník, vďaka ktorému je možné preniesť video a 7.1 audio signál v 24bit/192kHz formáte cez DVI výstup. Prevodník spĺňa HDMI-1.3 štandard a umožňuje vďaka UVD 2.0 v RV770 prenos Dolby-Digital (+), AC3, Dolby True-HD, DTS a DTS HD zvukovej stopy z DVD, Blu-ray alebo HD-DVD. Samozrejmosťou sú dva CrossFire X konektory, vyvedené na hornej strane PCB. Problematike CrossFire sme sa venovali v recenzii: AMD/ATi Radeon HD 3870 (CrossFire).





Gigabyte GeForce 9800 GTX grafická karta


Ďalšia grafická karta, ktorá sa dostala do našej redakcie je GeForce 9800 GTX od spoločnosti Gigabyte s celým názvom „GV-NX98X512H-B“. Drží sa referenčného dizajnu (chladič, PCB) a referenčných pracovných frekvencií. Voči ostatných štandardným GeForce 9800 GTX sa preto líši jedine nálepkou na dvojslotovom chladiči. Balenie a obal v ktorom môžete grafickú kartu zakúpiť, sa drží dizajnovej línii Gigabyte a nemusí byť podľa každého vkusu. Na prednej strane dominuje rovnaká ženská postava ako na chladiči z nejakého fantasy sveta a nápis GeForce 9800 GTX. Samotná grafická karta je zabalená v protistatickom vrecúšku a vystlaná dookola s polystyrénom. Nad ňou a v separátnom priečinku je príslušenstvo.


Okrem klasicky pribalených adaptérov: 2xDVI-to-D-Sub, S-Video-to-YUV, 2xnapájania - molex-to-6Pin VGA sa v ňom nachádza už len inštalačné CD od Gigabyte s ovládačmi GeForce, rýchla inštalačná príručka a manuál. Jedná sa o štandardné príslušenstvo retail verzie len s tým najpotrebnejším. Kto očakával nejakú hru alebo 3DMark zostane sklamaný. Vďaka tomu ale môže Gigabyte ponúknuť grafickú kartu za výhodnejšiu cenu ako ostatní výrobcovia. Komu teda nezáleží na príslušenstve, ale na cene, bude spokojný.


Momentálne už, žiaľ nie je dostupná v Slovenskej republike skoro žiadna GeForce 9800 GTX. Cena posledných kariet sa pohybovala okolo 4800 Skk (159,33 EUR). Nahradila ju GeForce 9800 GTX+, ktorá stojí momentálne okolo 5700 Skk (189,20 EUR), podobne ako Sapphire Radeon HD 4850 Toxic. GeForce 9800 GTX patrí do rovnakého segmentu ako Radeon HD 4850, teda mainstreamu. Jej cena bola po vydaní menovanej karty znížená, keďže aj jej výkon je mierne nižší. Môžme preto očakávať pomerne dobrý pomer cena/výkon. Viac si povieme v zhrnutí. Pozrieme sa teraz na grafickú kartu a jej fyzikálne vlastnosti.

Čierne PCB a rozloženie prvkov je úplne identické s referenčným návrhom. Napätie jadra G92 je takisto štandardných 1,15V. Pri ňom pracuje jadro na frekvenciách 675 MHz jadro, 1688 MHz shader-core a 1100 MHz (reálne) pamäť. Spolu s výpočtovými jednotkami nám to dáva nasledovné technické parametre:

Technické parametre:
Názov grafickej karty:
Gigabyte GeForce 9800 GTX
Veľkosť pamäte VRAM:
512 MiB
Čip: G92
Pracovná frekvencia jadra: 675 MHz
Frekvencia shader core: 1688 MHz
Pracovaná frekvencia pamäte: 1100 MHz
Teoretické peak hodnoty @ 675/1688/1100 MHz
Pixel fillrate:
10 800 Mpixels/s
Texel fillrate:
43 200 Mtexels/s
Z sample rate:
43 200 Msamples/s
AA sample rate: 86 400 Msamples/s
Aritmetický výkon: 648,2 GFLOPs/s
Geometry rate: 675 Mtriangles/s
Priepustnosť pamäte: 70,4 GB/s




Po určitých nevydarených experimentoch s chladičmi na high-end grafických kartách sa nVidia dopracovala k jednotnému dizajnu chladičov. Prvotne bol chladič vyvinutý pre GeForce 8800 GTX/GTS a neskôr pre GeForce 8800 GTS-512. Teraz sa s malými zmenami nachádza na GeForce 9800 GTX. Po stránke hluku a výkonu predstavuje jeden z najlepších referenčných chladičov. Pokrýva celú prednú stranu karty a chladené je jadro a pamäť. Základňa a množstvo lamiel je vyrobených z hliníka. Pre lepšie chladenie pamätí sa v nej nachádzajú vyvýšeniny s teplovodivými padmi. Nad 65m jadrom G92 sa nachádza medená platňa v ktorej sú zapustené 3 heat-pipes pre lepší odvod tepla. Nanesená bola znovu štandardná sivá teplovodivá pasta od neznámeho výrobcu. Ako ventilátor sa využíva radiálny 5,28W ventilátor Delta BFB1012L s priemerom 70mm. Ten sa nachádza vo všetkých referenčných chladičoch od nVidie a má 4pin konektor s PWM riadením. Princíp chladenia je zhodný s inými dvojslotovými chladičmi a pomerne rýchlo vysvetlený. Ventilátor nasáva zo skrinky vzduch, ktorý následne fúka na pasív s množstvom lamiel. Nakoľko má karta dvojslotovú záslepku so štrbinami, je teplý vzduch vyfukovaný zo skrinky. Chladenie by si malo vedieť poradiť s chladením karty pri nízkej úrovni hluku, nakoľko produkuje len mierne väčšie teplo ako GeForce 8800 GTS-512, ktorej chladenie je tiché. Pri práci vo Windowse si GeForce 98000 GTX nedokáže ako ostatné grafické karty založené na G9x znížiť automaticky pracovné frekvencie a pracuje naďalej so štandardnými 3D taktami. Napriek tomu je ventilátor v 2D tichý. Bližšie informácie v časti hlučnosť, teploty, spotreba. Karta podporuje aj Hybrid-SLI a tak je možné ju v 2D vypnúť a nechať renderovať obraz integrovanej grafickej karte.


GeForce 9800 GTX dostala kvôli mierne vyšším pracovným frekvenciám ako GeForce 8800 GTS-512 štvorfázové napájanie, keďže je GPU najväčším odberateľom. Napájanie je založené na Primarion PX3544 radiči. Podobné radiče sú na všetkých GeForce G92 grafických kartách. Pamäte GDDR 3 majú nezávislí dvojfázový radič od Anpec APW7066. Celkovo pôsobí napájanie zbytočne predimenzovaným dojmom. TDP rovných 160W si napriek podpore PCI-Express 2.0 vyžiadalo daň v podobe dvoch PCI-Express 1.0 6Pin konektorov na konci grafickej karty. Sú umiestnené na rovnakom mieste ako ich nájdete na GeForce 8800 GTX.




Na dvanásť vrstvovom PCB karty sa nachádza dokopy 512 MiB (8 čipov po 64MiB0,83ns GDDR 3 pamäte Samsung s označením K4J52324QE-BJ08, ktoré majú pracovné napätie 1.9V a 1200MHz (reálne) rating. Na Gigabyte grafickej karte sú prevádzkované s 1100 MHz. Určitý priestor na pretaktovanie tu preto je. V spojení s 256bit externou zbernicou dostávame priepustnosť 70,4GB/s. To je menej ako mala GeForce 8800 GTX (86,4 GB/s) a viacej ako je k dispozícii štandardnej Radeon HD 4850 s 1ns GDDR 3 pamäťou (63,5 GB/s). Vďaka schopnosti jadra G92, vedieť lepšie využiť priepustnosť, by mala voči 8800 GTX limitovať naozaj len v extrémnych prípadoch. Celková dĺžka karty je zhodná s GeForce 8800 GTX alebo GTX 280 ~ 27 cm, skoro 4 cm viacej ako má Radeon HD 4850 a 4870. V určitých menších skrinkách preto môže nastať problém s nedostatkom miesta – grafická karta je dlhšia ako základná doska a môže napr. kolidovať s klietkou pre HDD. Vidieť viaceré znaky – predimenzované napájanie, chladenie, ktoré hovorí jasnou rečou. Pôvodne plánovaným vysokým frekvenciám sa jadro G92 nepriblížilo tak, ako sa očakávalo.


Na zadnej strane karty je vyvedený štandardne jeden HDTV a dva dual-link DVI výstupy podporujúce HDCP. Nie je preto problém vysielať chránený obsah v rozlíšení 2560x1600 pix. Možnosť prenášať aj audio signál cez DVI-to-HDMI konektor ako s Radeon HD 2000 až 4000 grafickými kartami nie je podporovaná. Preto je na hornej strane PCB, pri prídavnom napájaní, jeden audio konektor. Spojiť ho možno s 2Pin S/PDIF výstupom na vašej základnej doske alebo zvukovej karte. Oproti GeForce 8800 GTS-512 je podporované Triple-SLI, a preto sú na hornej hrane vyvedené hneď dva SLI konektory.





Technické údaje grafických kariet

Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty. Radeon HD 4850 dosahuje napriek nižšej pracovnej frekvencii jadra vyššie viaceré teoretické hodnoty ako HD 3850/3870, nakoľko má jadro RV770 v prorovnaní s RV670 viac výpočtových jednotiek.

Radeon HD 3850

Radeon HD 3870

Radeon HD 4850

Radeon HD 4850 Toxic

Jadro:
RV670 RV670 RV770 RV770
Výrobný proces:
55nm 55nm 55nm 55nm
Veľkosť jadra:
~192 mm^2 ~192 mm^2 ~256mm^2
~256mm^2
Počet tranzistorov:
~666 miliónov ~666 miliónov ~956 miliónov
~956 miliónov
Frekvencia jadra:
670 MHz
775 MHz 625 MHz
675 MHz
Frekvencia pamäte:
830 MHz 1125 MHz
999 MHz
1150 MHz
Kapacita, typ pamäte:
512MiB, GDDR3 512MiB, GDDR4
512MiB, GDDR3 512MiB, GDDR3
Frekvencia shadercore:
670 MHz
775 MHz
625 MHz
675 MHz
Počet TFUs:
16 16 40
40
Počet TAUs:
32 32 40
40
Počet ALUs:
64x Vec5 (320 SPs)
64x Vec5 (320 SPs)
160x Vec5 (800 SPs)
160x Vec5 (800 SPs)
Počet ROPs
16 16 16
16
Podpora D3D: 10.1 10.1 10.1 10.1
Pixel fillrate:
10 720 Mpixels/s 12 400 Mpixels/s 10 000 Mpixels/s
10 800 Mpixels/s
Bilinear texelfillrate:
10 720 Mtexels/s 12 400 Mpixels/s 25 000 Mtexels/s
27 000 Mtexels/s
Bilinear FP-16
texel fillrate:

10 720 Mtexels/s 12 400 Mtexels/s 12 500 Mtexels/s
13 500 Mtexels/s
Z-sample rate:
21 440 Msamples/s 24 800 Msamples/s 40 000 Msamples/s
43 200 Msamples/s
AA-sample rate: 42 880 Msamples/s 49 600 Msamples/s 80 000 Msamples/s
86 400 Msamples/s
Aritmetický výkon: 428,8 GFlop/s 496 GFlops/ 1000 GFlop/s
1080 GFlop/s
Geometry rate: 670 Mtriangles/s 775 Mtriangles/s 625 Mtriangles/s
675 Mtriangles/s
Šírka zbernice:
256 bit 256 bit 256 bit
256 bit
Priepustnosť pamäte: 53,1 GB/s 72 GB/s 63,5 GB/s
73,6 GB/s


GeForce 8800 GT

GeForce 8800 GTX

GeForce 9800 GTX

GeForce 9800 GTX+

Jadro:
G92 G80 G92 G92b
Výrobný proces:
65nm 90nm 65nm 55nm
Veľkosť jadra:
~325 mm^2 ~484 mm^2 ~325 mm^2 ~276 mm^2
Počet tranzistorov:
~754 miliónov ~681 miliónov ~754 miliónov ~754 miliónov
Frekvencia jadra:
600 MHz 575 MHz 675 MHz 738 MHz
Frekvencia pamäte:
900 MHz 900 MHz 1100 MHz 1100 MHz
Kapacita, typ pamäte:
512MiB, GDDR3 768MiB, GDDR3 512MiB, GDDR3 512MiB, GDDR3
Frekvencia shadercore:
1512 MHz 1350 MHz 1688 MHz 1836 MHz
Počet TFUs:
56 64 64 64
Počet TAUs:
56 32 64 64
Počet ALUs:
7x Vec16 (112 SPs) 8x Vec16 (128 SPs) 8x Vec16 (128 SPs) 8x Vec16 (128 SPs)
Počet ROPs
16 24 16 16
Podpora D3D: 10 10 10 10
Pixel fillrate:
9600 Mpixels/s 13 800 Mpixels/s 10 800 Mpixels/s 11 808 Mpixels/s
Bilinear texelfillrate:
33 600 Mtexels/s 18 400 Mtexels/s 43 200 Mtexels/s 47 232 Mtexels/s
Bilinear FP-16
texel fillrate:

16 800 Mtexels/s 18 400 Mtexels/s 21 600 Mtexels/s 23 616 Mtexels/s
Z-sample rate:
38 400 Msamples/s 55 200 Msamples/s 43 200 Msamples/s 47 232 Msamples/s
AA-sample rate: 76 800 Msamples/s 110 400 Msamples/s 86 400 Msamples/s 94 464 Msamples/s
Aritmetický výkon: 508 GFlop/s 518,4 GFlop/s 648,2 GFlop/s 705 GFlop/s
Geometry rate: 600 Mtriangles/s 575 Mtriangles/s 675 738
Šírka zbernice:
256 bit 384 bit 256 bit 256 bit
Priepustnosť pamäte: 57,6 GB/s 86,4 GB/s 70,4 GB/s 70,4 GB/s


Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670/RV770 je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.

Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom RV770, RV670, G80 a R600:




Testovacia zostava

Každú grafickú kartu sme testovali na nasledujúcej zostave s čisto formatovaným pevným diskom a nanovo nainštalovaným operačným systémom.

Testovacia zostava:

  • Procesor: Intel Core 2 E 6600 (2 jadrový procesor, 65nm, 2x2MiB = 4MiB L2 cache, 1066MHz FSB) pretaktovaný na 3.6 GHz, 1600MHz FSB, 9x násobič
  • Vodou chladený procesor @ Alphacool Cool Answer PRO
  • Základná doska: Gigabyte GA-X38-DQ6 (čipset Intel X38, podpora 1600MHz FSB, 45nm procesorov)
  • RAM: 2GiB DDR 2 Corsair, 800MHz MHz (4-4-4-12-2T)
  • HDD: 750GB Western Digital Caviar 7500AAKS
  • Zdroj: X-Spice Croon BF 650, 620W (80+)
  • DVD mechanika: Plextor PX-716A
  • Operačný systém: Windows Vista Ultimate 32bit, Service Pack 1, so všetkými dostupnými záplatami
  • Monitor: Samsung SyncMaster 2693HM (26", max. 1920x1200)
  • Viac informácií ...


Za poskytnutie produktov by sme sa chceli poďakovať spoločnostiam:
Bez ich podpori by nebolo možné uskutočniť túto recenziu.

Použité ovládače:

  • Catalyst 8.8 WHQL pre Radeon grafické karty
  • GeForce 177.70 Beta pre GeForce grafické karty
Testované grafické karty:

Pre väčšie množstvo výsledkov sme simulovali podtaktovaním, respektíve pretaktovaním našich kariet
ďalšie dve grafické karty - referenčnú Radeon HD 4850 a GeForce 9800GTX+.
  • Sapphire Radeon HD 4850, 512MiB VRAM (RV770), 625/993MHz, GPU-Z validate
  • Sapphire Radeon HD 4850 Toxic, 512MiB VRAM (RV770), 675/1100MHz, GPU-Z validate
  • Gigabyte 9800 GTX, 512MiB VRAM (G92), 675/1688/1100MHz, GPU-Z validate
  • Gigabyte 9800 GTX+, 512MiB VRAM (G92), 738/1836/1100MHz, GPU-Z validate
 
(GPU-Z 0.2.6 rozpoznáva správne všetky testované grafické karty, novšia verzia
pridáva aj údaj, kedy bol čip predstavený. V prípade G92 je tento dátum nesprávny)
 

Použité benchmarky:

Syntetické:
  • 3DMark 2006, verzia 1.1.0 s hotfixom
  • 3DMark Vantage, verzia 1.0.1
  • Fillrate Tester
  • FableMark 1.0
  • ShaderMark 2.1
Hry:
  • Assassin´s Creed, D3D 10, verzia 1.2
  • Call of Duty 4: Modern Warfare, DX 9, verzia 1.7
  • Call of Juarez D3D 10, Benchmark Demo
  • Crysis, D3D 10, verzia 1.2.1
  • Devil May Cry 4, Demo, D3D 10
  • Enemy Territory: Quake Wars, DX 9, verzia 1.4
  • FEAR Perseus Mandate, DX9, verzia 1.0
  • Lost Planet: Extreme Condition, D3D10, Benchmark Demo
  • Need For Speed: Pro Street, DX 9, verzia 1.1
  • Race Driver: GRiD, DX9, verzia 1.1
  • Unreal Tournament 3, DX 9, verzia 1.3
  • World in Conflict, D3D 10, verzia 1.009
Každý test prebehol kvôli správnosti trikrát a bol vytvorený priemer, ktorý bol následne zaokrúhlený. Presné nastavenia nájdete pri výsledkoch konkrétnej hry. Vo všeobecnosti sme testovali s maximálnymi detailami v rozlíšeniach: 1280x1024 a 1600x1200. Jedenkrát so 4xMSAA, 16xAF a druhýkrát s 8xMSAA, 16xAF. Pokiaľ nebolo možné zapnúť AF v hre, vynútili sme si ho v ovládači, podobne sme postupovali pri AA. Vyššie rozlíšenie s AA, AF je ideálnejšie, nakoľko nelimituje tak procesor. Rozlíšenie 1280x1024 sme zaradili do testov preto, aby sme mohli porovnať výkon aj so slabšími grafickými kartami. TSSAA (nV) a QAAA (ATi) sme nechali vypnuté, kvôli rozdielom a problémom s kompatibilitou.

Použité programy:
Nastavenia v grafických ovládačoch:

Po dôkladnom premyslení a analýzach kvality obrazu oboch čipov sme sa rozhodli pre nasledujúce nastavenia kvality obrazu v ovládačoch:

nVidia ForceWare:
  • Texture filtering - Quality: High-Quality
  • Force Mimmaps - Trilinear
  • Texture filtering - Negative LOD bias: Clamp
  • V-sync: Force Off
  • Antialiasing (AA): Application-controlled, 4xMSAA/8xMSAA
  • Antialiasing - Gamma correction: On
  • Anisotropic filtering (AF): Application-controlled/16x
  • Antialiasing - Transparency: Off



ATi Catalyst:
  • Catalyst AI: Standard
  • Mipmap Detail Level: High Quality
  • V-sync: Always Off
  • Antialiasing (AA): Use application settings, 4xMSAA/8xMSAA (box filter)
  • Anisotropic filtering (AF): Use application settings/16x
  • Adaptive Antialiasing: Off





Výsledná kvalita obrazu je teda podobná, dosiahnuť úplne identickú je ale momentálne nemožné. Bližšie sme sa venovali kvalite obrazu v článku: R600 pod drobnohľadom (časti: Porovnanie AA, AF, AI), kde je kvalita obrazu čipu R600 porovnaná s G80. Nakoľko vychádza RV770 z R600 sa ani kvalita obrazu nezmenila voči R600. Rovnako to platí pri porovnaní G92/G94 s G80. Ako vidieť z nastavení, G8x/9x grafické karty poskytujú väčšie možnosti nastavenia kvality a majú s maximálnym nastavením kvalitnejší, takmer dokonalý anisotropný filter.




Syntetické benchmarky

Fillrate tester

Fillrate tester je malý ale veľmi užitočný program na meranie fillrate-ov jednotlivých grafických kariet. Na rozdiel od fillrate testera v 3DMarku2006, ktorý je v prípade Single-Texturing veľmi limitovaný priepustnosťou pamäte, dokáže tento program merať rôzne druhy fillratov. My sme nechali prebehnúť všetky merania. Použité shadre v teste sú pomerne krátke a zaťažujú aj dosť priepustnosť, preto sme použili max. možné rozlíšenie, aby sme ťažisko preniesli na fillrate. Testovali sme v rozlíšení 1600x1200, 32-Bit, 24-Bit Z a 8-Bit Stencil buffer s obnovovacou frekvenciou 60Hz.





Vďaka výkonnejším ROPs s väčším počtom z samplov za takt dosahuje RV770 oveľa vyššie výsledky v 2. teste - FFP - z pixel rate ako predchádzajúce čipy od AMD/ATi. Na G92 to podľa testu nestačí. Ďalej možno povedať, že čím komplikovanejšie textúry, tým je G92 viac pred RV770. Ostatné aritmetické pixelshader testy vyhovujú, až na dve výnimky, viacej skalárnej architektúre GeForce čipu.

Fablemark


Fablemark bol podobne ako jeho nástupca templemark vyvinutý spoločnosťou PowerVR. Predstavuje pomerne staré techdemo s veľkým podielom overdraw, ktoré malo vtedy ukázať silné stránky TBDR architektúry čipu „Kyro“. Tou je stencil výkon stencil buffera, ktorý limituje v tomto teste. Vďaka tomu poukazuje na ROPs výkon grafických kariet.


To, že sa výkon ROPs RV770 oproti RV670 výrazne vylepšil, dokazuje aj tento graf. Na G92, GeForce 9800 GTX a GTX+ to žiaľ ani tu nestačí. Podstatný je v konečnom výsledku, výkon v hrách.

Shadermark


Shadermark 2.1 je syntetický benchmark určený na meraniu pixelshader výkonu grafických kariet od tommti-systems. Vďaka častým updatom ide benchmark stále s dobou a podporuje aj Shader Model 3.0. Hodí sa preto k porovnaniu moderných architektúr. Benchmark testuje výkon v 25 rôznych shaderoch, ktoré sú napísané pomocou HLSL (High Level Shader Language).


Vo viacerých shaderoch dokáže RV770 ukázať svoj aritmetický výkon 1TFlops/s. G92, ktorá má teoreticky menší aritmetický výkon, sa presadil hlavne v posledných siedmych shaderoch, ktoré pravdepodobne viacej vyhovujú jeho architektúru.




3DMark 2006



ilustračný obrázok
Pravdepodobne jeden z najznámejších benchmarkov od spoločnosti „Futuremark“ vo verzii z roku 2006 má označenie 3DMark2006. Zo šiestich testovaných scén merajú štyri výkon grafickej karty. Dva sú určené pre test výkonu procesora. Pre dosiahnutie očarujúcich scén siahli vývojári po moderných 3D technológiách. Využíva sa Shader Model 3.0, textúry s vysokým rozlíšením, komplexné výpočty tieňov, dynamické osvetlenia, high dynamic range rendering (HDR-R). Futuremark vsadil na FP-16 HDR, ktoré poskytuje momentálne najlepšiu možnú kvalitu, ale je aj najnáročnejšie na výpočet. Testovali sme v custom nastavení - rozlíšenie 1600x1200 so 4xMSAA, 16xAF pre zamedzenie CPU limitu.




Feature 3DMark 2006 testy: Radeon HD 4850 Radeon HD 4850 Toxic GeForce 9800 GTX GeForce 9800 GTX+
Fill Rate - Single-Texturing  7088,521 MTexels/s
 8279,976 MTexels/s
 5445,797 MTexels/s
 5948,972 MTexels/s
Fill Rate - Multi -Texturing  19806,477 MTexels/s
 21388,855 MTexels/s
 31854,592 MTexels/s
 34869,027 MTexels/s
Pixel Shader  487,602 fps
 529,094 fps
 440,612 fps
 467,706 fps
Vertex shader - Simple  290,889 MVertices/s
 314,160 MVertices/s
 269,955 MVertices/s
 294,481 MVertices/s
Vertex shader - Complex  150,898 MVertices/s
 166,122 MVertices/s
 135,016 MVertices/s
 146,655 MVertices/s
Shader Particles (SM 3.0)  138,045 fps
 159,439 fps
 96,302 fps
 98,274 fps
Perlin Noise (SM 3.0)  232,864 fps
 248,980 fps
 148,039 fps
 161,948 fps

Napriek tomu, že má 3DMark 2006 testovať hlavne výkon grafických kariet, je aj v GPU testoch dosť limitovaný výkonom procesora. Výnimku predstavuje jedine HDR 1 test - "Canyon Flight". Okrem toho si potrpí tento 3DMark na vertex shader a FP-16 výkone. Prvý GPU test potrebuje hlavne texelfillrate, v ďalších troch už prevažuje potreba aritmetického výkon. Preto dosahujú GeForce karty so 64 TMUs jedine v prvom teste vyšší výsledok. Kvalitne optimalizované ovládače sú už viac-menej samozrejmosť. Tzv. feature testy sme museli uskutočniť v rozlíšení 1600x1200 bez MSAA, AF, keďže vyhladzovanie hrán a anizotropný filter nie sú podporované. Prvé dva sú zamerané na texelfillrate a RV770 sa darí vďaka zmenám v architektúre, konkrétne 40 TMUs. V pixelshader teste vie nový čip od AMD/ATi ťažiť z vysokého pixelshader výkonu, 1TFlops/s, aj keď mu shader očividne "nechutí". Vo vertexshader testoch však už nedosahuje také výsledky ako RV670. Dôvodom je nezmenený triangle setup, ktorý pracuje s rovnakou frekvenciou ako jadro. Keďže sa pracovné frekvencie nezvyšovali, ale naopak o 25MHz znížili je toto logický výsledok. Posledné dva SM 3.0 testy ťažia znovu z vysokého teoretického aritmetického výkonu. Výsledky ale netreba preceňovať, viac ako výkon v 3DMark 2006 neukazujú.




3DMark Vantage



ilustračný obrázok

Najnovší prírastok do rodiny 3DMarkov od fínskeho výrobcu softvéru Futuremark s názvom „Vantage“ je pokračovateľom 3DMark 2006, ktorý po vizuálnej stránke už nezodpovedal dobe a s novšími grafickými kartami bol čoraz viac limitovaný procesorom. Vývojári sa preto rozhodli pri novinke vsadiť na Direct3D 10 API, v ktorej je od základu naprogramovaný. Jeho technická stránka je celkovo na veľmi vysokej úrovni a druhý GPU test „New Calico“ ponúka aj po vizuálnej stránke veľa. Sú použité fyzikálne korektné simulácie pohybu látok, Parallax Occlusion Mapping, FP-16 HDR rendering, Depth of Field, Raytracing a ešte mnohé iné render techniky či efekty. Nie je prekvapením, že aj najnovšie grafické karty nedokážu zobrazovať veľa obrázkov za sekundu na obrazovkách. Viac informácií si môžete prečítať v recenzii: 3DMark Vantage. Naše grafické karty sme testovali v rozlíšení 1600x1200 so zapnutým 4xMSAA, 16xAF a detailami nastavenými na extreme. Keďže sa jedná o tzv. custom preset, nie je na konci testu zobrazené celkové scóre.




Feature 3DMark Vantage testy: Radeon HD 4850 Radeon HD 4850 Toxic GeForce 9800 GTX GeForce 9800 GTX+
Texture Fill  652,49 GTexels/s
703,01 GTexels/s  603,89 GTexels/s
 660,09 GTexels/s
Color Fill  3,32 GPixels/s
3,87 GPixels/s  3,28 GPixels/s
 3,30 GPixels/s
Parallax Occlusion Mapping  18,05 FPS
18,66 FPS  15,57 FPS
 16,75 FPS
GPU Cloth  15,67 FPS
17,04 FPS  22,50 FPS
 23,60 FPS
GPU Particles  26,30 FPS
29,04 FPS  25,64 FPS
 26,92 FPS
Perlin Noise  48,96 FPS
50,76 FPS  26,12 FPS
 28,67 FPS

Už podľa výsledkov vidieť, že nový 3DMark dáva kartám poriadne zabrať. V prvom GPU teste, ktorý je náročnejší, sa darí vďaka vyššiemu aritmetickému výkonu viacej Radeon grafickým kartám. Pozitívne je aj celkovo veľmi nízke zaťaženie nášho dvojjadrovéhi procesora, ktoré bolo v priemere pod 40%. Je to najmä vďaka Direct3D 10 a tomu, že GPU preberá viaceré výpočty – napr. simuláciu pohybu látky. Na koniec známe tvrdenie, 3DMark Vantage výsledky nemožno preceňovať, lebo obe spoločnosti (nVidia, AMD/ATi) naňho silne optimalizujú svoje ovládače. 




Assassin´s Creed


ilustračný obrázok

Čo sa stane, ak je konzolová hra úspešná? Presne, spraví sa port. Assassin´s Creed je tiež takýto prípad. Začiatkom apríla sa dostala do predaja PC verzia, ktorá je ale viac ako čistý port. Do hry bol pridaný nový obsah a Direct3D 10 render path, ktorý sa prejavuje hlavne filtrovanými tieňami. Základom je Scimitar engine z dielne Ubisoftu a middleware HumanIK od Autodesk-u, vďaka ktorému vyzerajú pohyby postáv veľmi realisticky. Kvalitné su určite aj textúry a svetelné efekty. Hlavná postava s menom „Altair“, za ktorú celý čas hráte, je nájomný vrah, alebo po anglicky assassin. Preto aj názov, ktorý znamená preložene „krédo vrahov“. Dej sa odohráva v období tretej križiackej výpravy do svätej zeme. Keďže neponúka hra žiadnu vstavanú možnosť ako otestovať výkon grafických kariet, boli sme odkázaný na vlastné merania pomocou FRAPS v prvej misii. Určitá odchýlka medzi meraniami preto mohla nastať. Takisto nebolo možné v hre pri rozlíšení 1600x1200 zapnúť „3/3 AA“.











Call of Duty 4: Modern Warfare


ilustračný obrázok

Tretí diel legendárnej 3D First-person shooter série pre PC od Infinity Ward (CoD 3 bolo pre konzoly), vydaný koncom minulého roka priniesol mnoho nových prvkov.V prvom rade presun do „fiktívnej súčastnosti“ čo hre rozhodne pomohlo. Bojuje sa na blízkom východe, v Rusku, na Ukrajine v okolí Černobylu, či dokonca na lodi uprostred mora. Arzenál opäť tvoria zbrane z reálneho sveta, každú si môžete v multiplayeri prispôsobiť podľa vlastných potrieb. Podobnosť s predchádzajúcim dielom je poznať hlavne v hernom štýle - stála akcia. Hra si našla určite aj vďaka tomu veľa fanušíkov a nadšencov.

DirectX9 engine vlastnej výroby využíva okrem už medzičasom bežného HDR-renderingu aj dynamické tiene, dynamické osvetlenia, depth of field (hĺbkovú neostrosť), parallax mapping a veľmi vydarenú simuláciu dymu. Voči predchádzajúcim dielom bola pridaná vlastná „physics“ engine, ktorá vypočítava priebeh letu guliek (je možné strieľať cez rôzne materiály) a simuluje pád tiel na zem pomocou ragdoll fyziky a predsimulovaných animácií. Engine je optimalizovaný aby využíval aj viac jadrové procesory.

Vďaka vstavanej funkcii multiplayer módu, zaznamenať timedemo sme nahrali vlastné na DM (death match) serveri a mape „Shipment“. Všetky detaily boli nastavené na maximum a okrem toho sa v danej dobe nachádzalo množstvo hráčov na serveri – o grafickú náročnosť teda bolo postarané.









Z jednotlivých grafov vyťaženia CPU vidieť, že naše timedemo je limitované hlavne grafickou kartou, pre množstvo bojových scén, výbucho, vrtulníkov a súperov. Na multiplayer sa len ťažko optimalizuje, lebo sú jednotlivé bojové scény skoro vždy jedinečné, naše testy teda odrážajú veľmi dobre skutočný výkon v COD4. Prekvapivé je, že napriek starému enginu, ktorý bol takmer kompletne prerobený, reaguje hra veľmi dobre na vyšší pixelshader výkon.


 




Call of Juarez

ilustračný obrázok

Poľský tvorca Techland siahol po veľmi netradičnom žánre „wester shooter“, navyše berúc na mušku meno iného First-person shooteru. Zahráte si za kňaza Raya McCalla, Billyho Candelu a jeho otca „Juareza“, ktorý stojí na čele tlupy banditov. Vybúriť sa môžete ako v šesťdesiatich rokoch 19. storočia - zajazdiť si na koni, vykradnúť vlak a nebude núdza ani o množstvo pištolníckych súbojov. Titul bol vydaný ešte v roku 2006 a beží na modifikovanom Chrome engine, ktorý dostal o rok neskôr aj podporu Direct3D 10. Hráča presvedčí vďaka hĺbkovej neostrosti (DOF), vydareným particle efektom využívajúce geometry shader, kvalitným textúram s vysokým rozlíšením, FP-16 HDR-renderingu, Parallax Occlusion Mappingu, shadow mapám, veľmi dobrým postavám a efektom. Po grafickej stránke sa preto nemusí za nič hanbiť a obstojí aj v ťažkej konkurencii. Nie je prekvapením, že dá poriadne zabrať moderným grafickým kartám. Pre naše testy sme využili Direct3D10 benchmark demo s maximálnymi detailami a vypnutým zvukom.



 





Call of Juarez sedí viac Radeon grafickým kartám, nakoľko bol jeho engine upravený v spolupráci s AMD/ATi. To sa nám potvrdilo aj teraz Jednotlivé scény majú v priemere ~ 1 milión polygonov, čo je naozaj veľa a sú limitované skoro vždy grafickou kartou. Podstatný je hlavne pixel, vertex a geometry shader výkon. .




Crysis


ilustračný obrázok

Názov hry hovorí asi za všetko. First-person shooter Crysis, neoficiálny pokračovateľ Far Cry, lebo využíva jeho ďalej vyvinutý engine s názvom „Cryengine2“, bol už dlho pred vydaním v pozornosti hráčov. Vývojárskym štúdiom je aj v tomto prípade nemecký Crytek, na čele s bratmi Yerli. Spolu s Hellgate: London patrí medzi veľké D3D 10 tituly, ktoré neboli vyvinuté Microsoftom. Hráte úlohu špeciálne vycvičeného amerického vojaka s kódovým označením „Nomad“, využívajúceho oblek „nanosuit“, ktorý bol vysadený so svojím tímom na krásnom ostrove s palmami, patriaci Servernej Kórei. Rovnako ako vo svojej dobe Far Cry, nasadil Crysis myslenú latku grafiky opäť tak veľmi vysoko, že to iným hrám bude trvať určitú dobu, pokiaľ sa k nej priblížia. Engine ponúka po grafickej stránke asi všetko momentálne dostupné a je navrhnutý tak, aby sa v budúcnosti dal ďalej rozširovať pomocou patchov. D3D 10 a 9 path, geometry shadery, dynamické tiene s vysokým rozlíšením, ambient occlusion maps, subsurface scattering,motion blur (neostrosť pri pohybe) & depth of field (hĺbkovú neostrosť), mormal maps, parallax occlusion maps, soft particles, HDR-rendering, pokročilé shadery a množstvo iných ľahôdok sa využíva v hre. Ďalšia informácie ku Cryenginu2 nájdete na oficiálnej stránke Crysis. Nie je prevkapujúce, že aj najsilenjším zostavám dáva hra zaberať.

Naše grafické karty karty sme testovali s nastavením detailov na „very high“, so 16x anizotropným filtrom a bez anti-aliasingu v , využívajúc timedemo funkciu. Prvý test „Contact“ predstavuje vstavaný GPU-benchmark. Druhý test s názvom „Paradise Lost“ je vlastné timedemo nahrané v snežnej krajine a je preto extrémne náročné.







Globálne možno povedať, že Crysis sedí viac GeForce grafickým kartám. Predsa len, vývoj prebiehal za pomoci piatich inžinierov nVidie a dvoch od AMD/ATi. Optimalizovalo sa do veľkej miery na G80 a GeForce 8800 GTX grafické karty. Bez ich pomoci by bežal Crysis ešte horšie. Čo to ale znamená pre nás? Crysis potrebuje aj napriek rôznym domnienkám hlavne fillraty a pomenej aritmetického výkonu (veď Radeon HD 4850 už má 1 TFlops/s). V druhom testovanom nastavení si napriek tomu darí novým Radeon grafickým kartám pre lepšiu správu priepustnosti a fillratov. Na plynulý zážitok vo veľmi vysokých rozlíšeniach si napriek tomu budeme musieť nejaký ten čas počkať, lebo aritmetický výkon stúpa rýchlejšie ako texelfillrate alebo Z-sample rate.



Devil May Cry 4


ilustračný obrázok

Démonická hack and slash akcia z produkcie japonského Capcom si to po niekoľkých mesiacoch namierila z konzol aj na PC. Engine hry , MT Framework, je už známy z Lost Planet a bol jedným z prvých využívajúcich Direct3D 10. Na rozdiel od nej, nie je štvrtý diel Devil May Cry až taký náročný na výpočtový výkon GPU. Upustilo sa hlavne od výpočtovo náročných a málo viditeľných efektov, techník. Okrem toho je hre dobre optimalizovaná a svižne sa hýbe aj na slabších strojoch. Ingame benchmark obsahuje testy na štyroch rôznych scénach zobrazujúc boje, ako ináč, s démonmi. Na výkonnostné testy grafických kariet sme využili druhý ingame benchmark, ktorý je najnáročnejší. Všetky detaily boli v hre nastavené na maximum (super high) a anizotropný filter bol zapnutý v ovládači.


















Enemy Territory: Quake Wars

ilustračný obrázok

Nasledovník Wolfenstein – Enemy Territory je poháňaný modifikovaným OpenGL Doom 3 enginom, ktorý bol doplnený o MegaTexture technológiu od známeho Johna Carmacka, soft particles, dynamické tiene, moderné shader efekty, prepočet fyziky a iné. Vďaka MegaTexture je možné aplikovať na statický terén obrovské textúry (až niekoľko GiB veľké s rozlíšením 32768×32768pix) namiesto veľkého množstva menších. Na rozdiel od Doom3 či Quake4 sa preto v ET:QW bojuje na rozsiahlych otvorených priestranstvách. Dynamiku hry dávajú rôzne bojové vozidlá.

Naše grafické karty sme testovali s nastavením kvality obrazu na „high“, okrem shaderov, ktoré boli nastavené na „ultra“ vo vlastnom, pre tieto účeli vyrobenom timedeme. Shadows, soft particles a smooth foliage bolo zapnuté pre dosiahnutie maximálnej kvality obrazu. Timedemo zachytáva tuhé boje vojakov ale aj ozbrojených vozidiel.





















FEAR Perseus Mandate

ilustračný obrázok

Je druhý datadisk po „Extraction point“ na známy hororový First-person shooter F.E.A.R. (First Encounter Assault Recon) vydaný koncom roka 2007. Dej Perseus Mandate sa odohráva súbežne s hlavným dejom FEAR a zmeny sa dočkal hlavne singleplayer. Pridali sa nové misie, postavy, mapy a zbrane. Z grafického hľadiska sa ale skoro nič nezmenilo. Naďalej je využívaný Lithtech DirectX 9 Jupiter EX engine s jeho technikou - parallaxmapping vytvárajúci diery po strelách v povrchoch, bloom spolu s farebnými filtrami na vytvorenie atmosféry, volumetric lighting & lightmapping dovoľujúce komplexné svetelné efekty, podpora Havok physics a kvalitné shadery, textúry. Testy výkonu grafických kariet sme uskutočnili v integrovanom benchmarku s maximálnymi detailami okrem možnosti „soft shadows“.















Žiadne nastavenie nespôsobovalo našim testovaným grafickým kartám väčšie ťažkosti, lebo hra využíva trochu starší engine, ktorý už zaostáva po grafickej stránke za novými. Kvôli komplexným výpočtom tieňov a svetla sú zaťažované hlavne ROPs.




Lost Planet: Extreme Condition

ilustračný obrázok

Predsavuje jednu z technicky najvyspelejších First-person shooterov vydaných v roku 2007. Ani skutočnosť, že PC verzia vznikla ako kvalitný port z Xbox 360 verzie na tom nič nemení, nakoľko bol MT Framework engine ďalej upravený. Bolo doňho implementovaných množstvo features ako motion blur, depth of field s vyššou kvalitou, „fur“ shadery, FP-16 frame buffer, vylepšený shadow map filtering, ambient occlusion, soft particles, advanced parallax mapping a dostal podporu Direct3D 10. Demo vydané v strede roka 2007 predstavovalo prvé hrateľné Direct3D 10 demo. Dej hry sa odohráva na "snežnej púšti", presnejšie na povrchu planéty E.D.N.III, z ktorej je ľudská kolónia vytláčaná hmyzoidnou rasou Akridov. V úlohe hlavného hrdinu sa dostávate na planétu, vyriešiť tento problém. Zastrieľate si na rozľahlých snežných pláňach, ale aj v temných interiéroch.

Výkonnostné testy sme uskutočnili pomocou vstavanej benchmark funkcie v Direct3D 10 s maximálnymi detailami. Nakoľko obsahuje benchmark dve scény – „snow“ a „cave“, sme testovali len v graficky limitovanom „snow“.















Počet polygonov v jednotlivých scénach je len priemerný, okolo 85 000, zaťaženie procesora je malé a počet draw calls je veľmi premenlivý, od 1000 do 4000. V benchmarku sú veľmi vyťažované hlavne TMUs a ALUs.





Need For Speed: Pro Street

ilustračný obrázok

Predstavuje už jedenáste pokračovanie "autíčkarskej" série Need For Speed, vydané 22. novembra 2007. Za Ryana Coopera si tentoraz zajazdíte legálne závody na Pro Street tratiach cez deň. Autá po dlhej dobe dostali model poškodenia, takže svojmu miláčikov môžete divou jazdou poriadne ublížiť. D3D 9 engine vlastnej výroby bol prepracovaný a trochu viac lesku mu dávajú particle & glow efekty, motion blur, dynamické osvetlenie, nové modely aút a detailné textúry. Preteky sú klasicky doplnené pomerne chytľavou hudbou.Testovali sme v úvodnej scéne preteku „Nevada Highway – Speed Challenge“ s maximálnymi detailami.





















Race Driver: GRiD


ilustračný obrázok

Závodný simulátor, vyvíjaný spoločnosťou Codemasters, predstavuj ďalšiu "chuťovku" roka 2008. Už podľa názvu sa dá zaradiť do Race Driver série, neprebral ale DTM základ. Beží na EGO engine, ktorý je odvodeného od NEON enginu známeho z Colin McRaeRallye: Dirt. Kompletne bol ale prerobený model poškodenia a interakcie s okolím. Práve fyzika a možnosť realisticky rozbiť svoje 4 kolesá zožalo veľký ohlas, podobne aj nemenej kvalitná vizuálna stránka hry – textúry, modely áut, osvetlenia. Súčasťou je 45 licencovaných motorových vozidiel, ktoré sú zaradené do 13 kategórií a 89 rôznych okruhov v Európe, Japonsku a USA. Pri testovaní výkonu sme museli znovu siahnuť po aplikácii FRAPS, ktorá zaznamenávala 45 sekúnd našej jazdy na okruhu Jarama Grand Prix. Meranie sa začalo hneď po štarte a snažili sme sa prejsť daný úsek bez kolízie. Všetky detaily v hre boli nastavené na maximum, 16x anizotropný filter bol vynútený ovládačom.






















Unreal Tournament 3

ilustračný obrázok

Unreal Tournament 3 je štvrtý diel z kultovej 3D First First-person shooter série „Tournament“ od Epic Games založený na novom „state of art“ Unreal Engine 3, ktorý si licencovalo množstvo vývojových štúdií pre svoje hry. Celkovo je tento diel ladený tak, aby nadväzoval na „jednotku“.

Unreal Engine 3 predstavuje prepracovaný DirectX 9 engine (D3D 10 renderpath je na ceste), ktorý je pastvou pre oči, nakoľko využíva HDR-rendering, kvalitné particle efekty, dynamické tiene, množstvo rôznorodých textúry a v neposlednom rade aj deferred shading. Z toho však vyplýva jeden nedostatok - nemožnosť zapnúť anti-aliasing priamo v hre. NVidia ako aj AMD/ATi tento nedostatok odstránili na svojich Direct3D 10 grafických kartách pomocou hacku v ovládačoch. Oficiálne je to možné až keby engine podporoval D3D 10.1. Výrazný je aj shimmering. Shannon a Nyquist by sa asi v hrobe otáčali, keby to videli. Viac sa o technických detailoch môžete dozvedieť priamo na unrealtechnology.

Na otestovanie výkonu našich grafických kariet sme použili integrovanú funkciu – Flyby (prelet) CTF mapou s názvom „Suspense“. Merania sa uskutočnili pomocou programu FRAPS. Detaily v hre boli nastavené na maximum, V-sync (bSmoothFrameRate = False) bola vypnutá.

















Ako vidieť na výsledkoch, s narastajúcim rozlíšením a AA,AF klesá postupne vyťaženie CPU a grafická karta sa stáva limitujúcim komponentom.







World in Conflict

ilustračný obrázok

Dnešné stratégie vyzerajú po grafickej stránke oveľa lepšie ako tie zpred pár rokmi, first-person shootery si však stále držia prvenstvo v použitej technike. Realtime strategy od švédskeho Massive Entertainment vydaná v roku 2007 je ale výnimočná v každom smere. Nielen po hernej, ale aj vizuálnej stránke. Masstech Game Engine obstojí v porovnaní s inými kvalitnými enginami, nakoľko ponúka Direct3D 10 spolu s anti-aliasingom, veľmi vydarené shader efekty (svetelné lúče prechádzajúce cez oblaky, tzv. God Rays, len v D3D 10), realistické soft shadows, detailné textúry s vysokým rozlíšením a animácie na vysokej úrovni. Spolu s medzisekvenciami rozprávajúcimi príbeh je vytvorená filmová atmosféra. Fiktívny dej o tom, že studená vojna začiatkom 90. rokov neskončila, ale vyústila v masívnu sovietsku inváziu na pôdu USA pridáva ďalej na atraktivite hry. Naše grafické karty sme testovali v integrovanom benchmarku s maximálnymi detailami.













Pretaktovanie grafických kariet

Pretaktovanie alebo v angličtine – overclocking (OC), predstavuje pomerne jednoduchú cestu, ako mierne zvýšiť výkon GPU a tým aj FPS v samostatných hrách. Prečo je ale možné pretaktovať GPU, teda zvýšiť jej pracovné frekvencie? Na konci vývojového cyklu GPU sa testujú a stanovujú pracovné frekvencie s ktorými bude čip neskôr vydaný. To, že sa plánované frekvencie skoro nikdy nepodarí dosiahnuť a výrobca je obmedzený fyzikálnymi zákonmi, nechám bokom. Dôležitý je v tomto prípade fakt, že s určitou, nazvime ju, predreferenčnou frekvenciou, musí čip vydržať množstvo extrémnych testov v laboratóriu a ešte aj tak sa táto frekvencia zníži o zhruba 12%, aby mal výrobca istotu, že veľa čipov ju dosiahne a nebudú pri normálnych podmienkach kazivé. Uvediem príklad. Určitý čip musí v laboratóriu vydržať minimálne 700 MHz, aby sa mohol predávať s frekvenciou ~ 620 MHz. V normálnych podmienkach, s lepšie chladenou skrinkou, alebo lepším chladením je preto vždy možné dosiahnuť zvýšenie frekvencií. Súčasťou našich testov sa teda stalo aj pretaktovanie grafických kariet. Áno, pretaktovanie je vždy aj o šťastí. Nemožno preto aplikovať všeobecné pravidlo, že naše frekvencie dosiahne každá daná karta. Pokiaľ by ale boli základné predpoklady – chladenie, napätie jadra a iné rovnaké, možno povedať, že veľké rozdiely medzi dosiahnutými frekvenciami nebudú.
Pre zistenie maximálnych stabilných taktov grafických kariet sme použili viaceré aplikácie. Keďže nepodporoval RivaTuner v čase testovania RV770, siahli sme po AMD GPU clock tool-e. V prípade G92 sme použili RivaTuner na zvyšovanie frekvencií. Najprv sme (pokiaľ to bolo možné softvérovo) zvýšili otáčky ventilátora na 100%. Potom sme postupovali metódou - zistenia nestabilného taktu, vykazujúceho artefakty a postupného znižovania frekvencie do stabilnej hodnoty, najprv v prípade jadra (shader core, ak má samostatnú clock domém) a potom pamäti. Stabilitu a artefakty sme po každej zmene frekvencii overovali aplikáciou ATiTool. Pokiaľ vydržal čip 5 minútové zaťaženie, nasledoval ďalší 10 minútový test stability vo FurMark, ktorý „zakúri“ poriadne každej grafickej karte. Touto procedúrou sme dosiahli maximálne a stabilné frekvencie, ktoré nevykazovali artefakty.

Sapphire Radeon HD 4850 Toxic sa nám podarilo pretaktovať zo štandardných 675/1150MHz na 710/1210MHz, čo predstavuje v prípade jadra a 0,83ns Samsung GDDR 3 pamäti ~5% pretaktovanie. Takéto vysoké frekvencie sa nám podarilo dosiahnuť len vďaka štandardne lepšiemu chladiču – Zalman VF-900. Percentuálne zvýšenie taktov sa ale môže niekomu zdať byť nízke, má to dva dôvody. Sapphire HD 4850 Toxic je už štandardne pretaktovaná a aj keď nás možno neobmedzovalo chladenie, napätie na jadre RV770 áno. Gigabyte GeForce 9800 GTX sme obdobne pretaktovali zo štandardných 675/1688/1100MHz na 783/1944/1188MHz. Jadro sa nám teda podarilo pretaktovať o 16%, shader core o 15% a GDDR 3 pamäť o 8%. Po úspešnom pretaktovaní sme otestovali výkon grafických kariet s vyššími pracovnými frekvenciami. Každá hra je multithread aplikácia a preto sa zvýšenie výpočtového výkonu, ak nič nelimituje, odrazí vo vyššom počte FPS. V určitých situáciách, hlavne pri min. FPS to môže byť rozhodujúce, či je hra ešte plynulá, alebo nie. Percentuálne zvýšenie výkonu je väčšinou adekvátne zvýšenému taktu. Testovali sme v 3DMark 2006, Vantage, Unreal Tournamente 3, Call of Duty 4, Call of Juarez a Crysis. Detaily boli vždy nastavené na maximum a ďalšie informácie o testoch sú v jednotlivých grafoch.
















Hlučnosť, teploty, spotreba

Hlučnosť:

Moderné grafické karty by nemali byť len výkonné, ale aj ich chladič by nemal pri práci (2D, 3D) vydávať vysoký hluk. Často je hlučnosť štandardného chladiča dôvod pre zákazníka sa rozhodnúť práve pre určitú kartu. V teste rozlišujeme tri kategórie – 2D, 3D a 100%, lebo všetky testované karty si regulujú otáčky ventilátora závisle od teploty.Hlučnosť v sme vo všetkých troch prípadoch merali pomocou hlukomeru „Voltcraft SL-100“, ktorý bol umiestnený v rovnakej výške, 1m od meraného zdroja hluku - grafickej karty. Nakoľko naša zostava nemá skrinku, merali sme s vypnutými ventilátormi. Jediným prídavným zdrojom hluku bol pevný disk a zdroj. Pomocou aplikácie RivaTuner sme manuálne prinútili pracovať ventilátor aj na 100% a následne zmerali hlučnosť.



Charakteristické úrovne hluku: dBA:
štart lietadla (60m) 120
stavba 110
krik (2m) 100
nákladné vozidlo (15m) 90
mestský chodník 80
interiér auta 70
normálny rozhovor (1m) 60
kancelária 50
obývačka 40
spálňa cez noc 30
nahrávacie štúdio 20
šuchot lístia 10

Chladič Zalman VF900 na Sapphire Radeon HD 4850 Toxic má jednu veľkú nevýhodu a tou je nemožnosť softvérovo ovládať otáčky ventilátora. Ten pracuje vždy s 1800 otáčkami za minútu, čo v 3D režíme nie je veľa. V 2D režíme je to ale negatívne vnímateľné. Oproti ostatným komponentov ho možno rozlíšiť. Referenčný chladič GeForce 9800 GTX pracuje v 2D s nízkymi otáčkami celkovo ticho a nevydáva žiadne nepríjemné zvuky. V 3D režíme, keď sa zvýši teplota jadra, už počuteľne zvýši otáčky. Nie je to ale nič tragické. Pri 100% otáčkach, ktoré by nemali byť dosiahnuté počas normálnej prevádzky nikdy, sú extrém. Vtedy je chladič veľmi hlučny. Môžme ešte skonštatovať, že regulácia otáčok pracuje veľmi dobre. Žiadne rýchle zvýšenie a následné zníženie otáčok v 2D režíme sme nezaznamenali.  

Teploty:

Hlučný chladič by grafická karta nemala mať. Podobne je to ale s teplotou – tá by nemala vystúpiť so štandardným chladičom príliš vysoko. Vyššou teplotou sa skracuje životnosť všetkých súčiastok a takisto má negatívny dopad ďalšie zvyšovanie frekvencií - pretaktovanie. Teplotám jednotlivých častí grafických kariet sme sa preto venovali pomerne komplexne. V tabuľke vidieť päť rôznych údajov. 2D merania sa uskutočnili 5 minút po nabootovaní systému do Windows Vista so zapnutou Aero plochou. Merania „pamäť“ a „vzadu“ sme uskutočnili pomocou laserového teplomera „Voltcraft IR-280“ na zadnej strane PCB. Pod pojmom „vzadu“ myslíme zadnú stranu jadra. Hodnota „jadro 2D“ bola vyčítaný pomocou aplikácie RivaTuner. Rovnakým spôsobom sme uskutočnili 3D merania po 30 minútach zaťažujúceho testu HDR 1 – „Canyon Flight“ v 3DMark2006.



Referenčný jednoslotový chladič na Radeon HD 4850 má problém držať teplotu jadra RV770 pri prijateľných hodnotách. Tento nedostatok rieši dobre VF900. Žiadna časť karty sa výraznejšie neprehrieva. Podobné teploty dosahuje v 3D aj GeForce 9800 GTX. Pri práci vo Windowse je žiaľ teplejšia, nakoľko nemá žiadne feature na vypnutie nepotrebných jednotiek, zníženie napätia a frekvencií. Po stránke teplôt to ale nie je nič hrozné. Oproti G80 sú to o dosť nižšie teploty.

Spotreba:

Nemohli sme zabudnúť ani na merania spotreby. Pomocou "Voltcraft Energy Monitor 3000" meracieho prístroja sme najprv 5 minút po nabootovaní operačného systému Windows Vista 32bit Ultimate so zapnutou Aero plochou zmerali spotrebu celej zostavy . Tento údaj je označený ako 2D. Maximálna spotreba v 2D, teda "peak 2D" je uvedená pre zaujímavosť. Pre zistenie spotreby v 3D sme nechali 30 minút bežať HDR 1 test "Canyon Flight" v 3DMark2006. Maximálna spotreba v 3D je v tabuľke označená ako "peak 3D".


Všetko nemusí vždy tak dopadnúť, ako sa očakávalo. Radeon HD 4850 Toxic je takýto príklad, keď spotrebuje v 2D viac ako GeForce 9800 GTX. To nie je najlepší výsledok, keď si uvedomíte, že má vylepšený PowerPlay s Clockgathingom. Je naozaj otázne, či je to problém ovládačov alebo dokonca hardvéru. Presne zodpovedať túto otázku dokáže jedine čas. Uvidíme. V 3D je spotreba adekvátna výkonu. GeForce 9800 GTX v tomto meraní nijak neprekvapila. Nepodporuje žiadne feature pre zníženie spotreby v 2D a tak je logicky jej spotreba pomerne vysoká. Pri zaťažení si grafická karta potiahne ešte viacej - dokonca mierne viacej ako HD 4850. To už by naozaj nebolo najlepšie vysvedčenie pre Radeon, keby malo 65nm G92 nižšiu spotrebu ako RV770 (aj keď je to len veľmi zjednodušené porovnanie).





Zhrnutie, záver

Podľa jednotlivých výsledkov na predchádzajúcich stranách vidieť, že AMD/ATi to dokázala. Radeon HD 4850 je mainstream grafická karta, ktorá predstavuje silnú konkurenciu pre najvýkonnejšie single GPU grafické karty GeForce 9000 série. Vďaka nízkej cene má takisto veľmi dobré predpoklady na to, aby sa stala novým kráľom pomeru cena/výkon. Poďme si to ale postupne zhrnúť.

 

Predchádzajúca séria Radeon HD 3000 dokázala držať krok s konkurenciou hlave vtedy keď nebolo zapnuté vyhladzovania hrán a anizotropný filter. Po zapnutí týchto features na vylepšenie kvality obrazu bola skoro vždy za konkurenciou. Nová séria Radeon HD 4000 vďaka RV770 a zmenám v architektúre dokázal dokonca otočiť tento negatívny stav. So zapnutým 4xMSAA a 16xAF sa drží Radeon HD 4850 celkovo na rovnakej úrovni ako GeForce 9800 GTX. Podľa hry je raz jedna, raz druhá mierne výkonnejšia. Oproti drahšej GeForce 9800 GTX+ zaostáva v priemere o 8%. Po zvýšení rozlíšenia na 1600x1200 sa už pomaly ukazujú výhody novej architektúry RV770 a nedostatočná priepustnosť GeForce kariet. Referenčná Radeon HD 4850 je naďalej na rovnakej úrovni ako GeForce 9800 GTX, rozdiel oproti GeForce 9800 GTX+ sa ale zmenšil na 5%.

Vďaka svojej architektúre vykazovala už RV670 menší prepad výkonu po zapnutí osemnásobného multisampling antialiasingu (8xMSAA) ako G9x. RV770 s mnohými vylepšeniami výkonu pokračuje v tomto trende a G92 dopláca na architektúru neprispôsobenú pre 8xMSAA. Oproti RV770 má G92 menšie pamäte cache, polovičný triangle setup, horšiu kompresiu pre antialiasing. Radeon HD 4850 je už v rozlíšení 1280x1024 s 8xMSAA a 16xAF sedemnásť (!) % pred GeForce 9800 GTX. Výkonnejšiu GeForce drží takisto s vyše 8% v šachu. Úplná degradácia GeForce dochádza v rozlíšení 1600x1200, kde je väčšina hier na Radeon HD 4850 ešte hratelná, s GeForce 9800 GTX ale nie. Rozdiel výkonu je v prospech referenčnej Radeon 31%. GeForce 9800 GTX+ nemá takisto šancu a pre rovnakú priepustnosť vykazuje len 3% nárast výkonu oproti 9800 GTX. Logicky je náskok Radeon HD 4850 oproti nej až 27%.


Keďže sme nemali k dispozícii referenčnú Radeon HD 4850 a výkonnostné výsledky sme docielili len podtaktovaním Sapphire Radeon HD 4850 Toxic, nemôžme sa úplne presne vyjadriť k spotrebe a teplotám, respektívne hlučnosti referenčného chladiča. Podľa viacerých kolegov, ktorý ale mali túto kartu, môžme zhrnúť, že ventilátor odvádza v 2D režíme pomerne ticho svoju prácu. Pre vysoké teploty je ale chladič v 3D hlučný. Nie je to prekvapenie, pretože 110W je pre daný singleslotový chladič naozaj maximum. Znížiť hlučnosť chladiča upravením otáčok v 3D sa preto neodporúča.

Negatívne vnímame aj spotrebu referenčnej Radeon HD 4850, ktorá je v 2D na úrovni GeForce GTX 280, napriek vylepšenému PowerPlay a informáciám zo strany AMD/ATi, že pracuje na RV770 2x efektívnejšie ako na RV670. Logicky sa vynárajú otázky, či je to spôsobené ovládačmi alebo dokonca hardvérom. Zatiaľ sme sa žiaľ ani s najnovším Catalystom 8.9 nedočkali zníženia spotreby vo Windowse. V 3D režíme je spotrebe referenčnej Radeon HD 4850 adekvátna podávanému výkonu, keďže sú rozdiely medzi GeForce 9800 GTX a menovanou Radeon zanedbateľné.


Spoločnosť Sapphire si pravdepodobne uvedomila nedostatky referenčnej Radeon HD 4850 a preto je Sapphire Radeon HD 4850 Toxic vybavená lepším chladičom, konkrétne Zalman-om VF900. Vďaka nemu je maximálna teplota jadra RV770 v záťaži 68°C. Napriek tomu nie je chladič v 3D hlučný, od iných komponentov ho ale možno odlíšiť. Táto veľká výhoda je zároveň aj veľkou nevýhodou, keďže nie je možné softvérovo meniť otáčky ventilátora. Ten pracuje v 2D režíme, keď sa karta podtaktuje, s plnými otáčkami, čo je okolo 1800 rpm. Oproti referenčnej karte je preto v 2D hlučnejší a pre ľudí, ktorý si potrpia na hlučnosti, k.o. kritérium. Dvojslotový referenčný chladič na Gigabyte GeForce 9800 GTX takúto nevýhodu nemá a v 2D sa jeho otáčky výrazne znížia. Chladič je veľmi dobre navrhnutý, vyfukuje teplý vzduch zo skrinky a nepracuje hlučne. Podobne sa správa aj v 3D, keď zvýši len mierne svoje otáčky. Od iných komponentov ho ale možno rozlíšiť. Dosahované teploty sú celkovo veľmi prijateľné.

Aj vďaka lepšiemu chladeniu mohla Sapphire zvýšiť pracovné frekvencie a hlavne frekvenciu pamäti, ktorá mohla na referenčnej karte v určitých situáciách limitovať – naše výsledky to dokazujú. Oproti referenčnej karte má Toxic verzia pretaktované jadro RV770 o 8% a 0,83nm pamäť GDDR3 o 16%. Celkovo vyšší výkon v testoch preto neprekvapuje. V najmenej náročnom nastavení – 1280x1024 so 4x multisampling-antialiasingom a 16x sample anizotropným filtrom je Radeon HD 4850 Toxci od Sapphire na rovnakej úrovni ako rovnako drahá GeForce 9800 GTX+. Oproti referenčnej Radeon HD 4850 sa vzdiali presne o vyššiu pracovnú frekvenciu jadra - 8%. Pravý výkon Toxic verzie sa začne ukazovať už pri vyššom rozlíšení, keď je oproti GeForce 9800 GTX+ o 5% výkonnejšia a referenčnej Radeon HD 4850 sa vzdiali na 10%.

Testy s 8xMSAA a 16xAF v rozlíšení 1280x1024 sú znovu v réžii Sapphire Radeon HD 4850 Toxic. GeForce 9800 GTX+ zaostáva o 19% a referenčná Radeon HD 4850 naďalej o 10%. Najvyššie rozdiely sú pochopiteľne v najnáročnejšom testovanom nastavení – 8xMSAA, 16xAF a rozlíšení 1600x1200. Toxic verzia je oproti GeForce 9800 GTX+ o 41% výkonnejšia, čo je rozdiel jednej triedy. Takisto najväčší rozdiel docieli voči referenčnej Radeon HD 4850 – okolo 11%. Po stránke výkonu preto nemožno Sapphire Radeon HD 4850 Toxic nič vyčítať. Splnila čo sa očakávalo.



Za vyššie napätie jadra a pracovné frekvencie sa ale musí platiť daň vo forme vyššej spotreby. Radeon HD 4850 Toxic preto neláme v tejto disciplíne žiadne rekordy. V 2D prevádzke sme namerali okolo 196W pre celú zostavu. Skoro žiadna zmena nenastala ani po výmene karty za GeForce 9800 GTX. Hodnota spotreby vo Windows Vista sa ustálila na 195W. Pri tom ale netreba zabudnúť, že G92 na GeForce grafickej karte nemá mechanizmy na rozdiel od RV770 ako znížiť spotrebu v 2D. Obe hodnoty sú preto okolo 8W nad spotrebou referenčnej Radeon HD 4850. V 3D prevádzke dostávame podobný obraz, keď s Radeon HD 4850 Toxic sme dosiahli o 4W nižšiu spotrebu ako s GeForce 9800 GTX.

Dostávame sa k jednému, pre mainstream grafické karty, veľmi podstatnému ukazovateľu, pomeru cena/výkon. Ako hodnoty docielili jednotlivé testované grafické karty?


pomer cena/výkon zobrazený v grafe predstavuje pomer celkového výkonu z testovaných hier a priemernej ceny grafickej karty na trhu získanej z viacerých e-shopov

Pre naše prekvapenie, dosiahla momentálne najvýkonnejšia testovaná grafická karta – Sapphire Radeon HD 4850 Toxic najlepší pomer cena/výkon. Tesne nasledovaná GeForce 9800 GTX, ktorá sa žiaľ po zlacnení už skoro nikde nedá dostať. Preto môžme túto hodnotu zanedbať. Referenčná Radeon HD 4850 dosahuje veľmi dobrý pomer cena/výkon a rýchla odpoveď nVidie- GeForce 9800 GTX+ na tom nič nemení. Tá obsadila posledné, štvrté miesto, pre rovnakú cenu ako HD 4850 Toxic, ale celkovo nižší výkon.

AMD/ATi ponúka vo forme Radeon HD 4850 výkonné grafické karty, ktoré sa nemusia báť konkurencie. Oproti Radeon HD 3850 a 3870 ponúkajú naozaj veľký výkonnostný skok, lebo tieto si nevedeli poradiť ani s GeForce 8800 GTX. Pri väčšine nastavení je výkon zrovnateľný s nedostupnou GeForce 9800 GTX a oproti drahšej GeForce 9800 GTX+ zaostávajú len mierne. Ich najväčšia výhoda ale spočíva v malom prepade výkonu s 8xMSAA. Okrem výkonu ponúkajú podporu Direct3D 10, PowerPlay alebo UVD 2.0, ktorý len hľadá konkurenciu. Negatíva sú vysoká teplota s referenčným chladičom a z toho vyplývajúci vyšší hluk. Pri tej všetkej eufórii netreba zabudnúť ani na to, že napriek 40 texturovacím jednotkám nemá RV770 taký kvalitný anizotropný filter ako G92. Či to niekomu vadí, alebo nie, nie je v tomto prípade podstatné, šetrí sa tým ~12% výkonu, čo v priamom porovnaní spraví svoj rozdiel.

GeForce 9800 GTX nie je v skutočnosti alternatíva, nakoľko nie je už skoro nikde dostupná. Drahšia GeForce 9800 GTX+ ponúka síce, ak nebudete používať 8xMSAA (lebo viditeľný rozdiel voči 4xMSAA je malý), vyšší výkon a lepší dvojslotový chladič, ale kvôli cene nemá až taký dobrý pomer cena/výkon. Ako bonus dostanete kvalitnejší anizotropný filter. V mainstreame, kde je cena dosť podstatný faktor to preto bude mať GeForce ťažké. Obe karty – Radeon aj GeForce majú svoje výhody a nevýhody. Mierna prevaha tu v podobe Radeon je, ale konečné rozhodnutie je samozrejme na zákazníkovi, ktorý najlepšie vie, čo naozaj potrebuje a čo nie.


Sapphire Radeon HD 4850 Toxic má odstránené viaceré nedostatky referenčnej HD 4850 a dosiahla z testovaných mainstream kariet najlepší pomer cena/výkon. Vďaka vyšším pracovným frekvenciám je jedna z najvýkonnejších sériovo predávaných Radeon HD 4850 a má osadený chladič Zalman VF900. Záujemcovia si ju môžu zakúpiť za 5700 Skk, čo je len mierne viac ako cena referenčnej Sapphire Radeon HD 4850. Keď k tomu pripočítame bohatú výbavu, dostávame takmer ideálnu mainstream grafickú kartu. Náš veľmi dobrý dojem kazdí jedine nemožnosť regulovať ventilátor vo Windowse. Napriek tomu sme sa rozhodli udeliť Sapphire Radeon HD 4850 Toxic naše odporúčanie v mainstreame a ocenenie najlepší pomer cena/výkon.


Na záver by sme sa chceli poďakovať spoločnosti Sapphire za vypožičanie Radeon HD 4850 Toxic a spoločnosti Gigabyte za vypožičanie GeForce 9800 GTX.




Odporúčame prečítať aj:




Komentáre (12)
SUBOSVK
Toxic na OC memory 1100 a nie 1150!
SimonB
testovali ste tie gk vy??? ja mam pocit ze to bol crux .. on vie asi lepsie ako sa prejavili schopnosti tych GK a suhlasim s nim
M1ch4l
pekne napisane, dal si si kus roboty s tym teda...mozno by som vyradil niektore zbytocne hry z testov, napr. need for money shitstreet. inak 4850 toxic od sapphiru by som nedal zrovna najlepsi pomer cena/vykon, lebo oproti inym 4850 je o dost drahsia a narast vo vykone je takmer nulovy
Memnon
no recenzia sa mi pacila akurat niektore casti boli trochu neprhladne ked sa raz obajvila karta s pomenovanim OC , + , Toxic alebo referencna a nevdel som co k comu patri a je mi jasne ze testy a podobne sa sa robia postupne ale 9800GTX+ sa da kupit za 4400,- v ageme a vazne neviem kde sa da kupit Toxic za taku cenu to by v celku zmenilo pomer Cena/vykon :)
crux2005
@Memnon: Ceny som použil z pondelka 6.10.2008, nepredpokladal som, že by sa od vtedy tak výrazne zmenili, žiaľ na Slovensku je asi všetko možné. Aký to má dôvod netuším. Takisto som nenašiel zmienenú GeForce 9800 GTX+ za 4400 Skk, asi to bude cena pre dílerov. @M1ch4l: stojím si za tým, čo som napísal. Radeon HD 4850 Toxic je vždy o ~10% výkonnejšia, má bohaté príslušenstvo a VF900. V porovnaní cena/výkon som zobral priemerné ceny z viacerých e-shopov a pre Toxic vychádzal tento pomer najlepšie. Pre mňa sú to dostatočné dôvody, aby som udelil ocenenie.
M1ch4l
samozrejme toxic ma dobry pomer cena/vykon, ale nemozem si akosi pomoct a ako hladim, tak hladim na alzu, co je sice hodne drahy shop, ale co uz a vidim tam gainward golden sample s vyssim taktom jadra ako u toxicu, nereferencnym chladenim a za cenu o 800 SK nizsiu a este k tomu ma gainward GS A palit sonic lepsie napajanie(8pin konektor). Za toxic si sapphire da celkom slusne priplatit, ale zda sa mi to vela...je to ale skreslene, pretoze na Slovensku su vseobecne sapphire drahsie ako gainward. Samozrejme uznavam, ze si udelil produktu ocenenie, len nie je 100% pravdive. Tiez mozu mat v alze stare ceny, lebo za to chcu akosi veeeelaaaa......bohate prislusenstvo vacsinou byva pri vsetkych OC kartach a ta VF900 nie je az taka hviezda, ale je to zalman zasa :)
Memnon
ja vazne netusim ci dealer alebo nie ale ak mas pristup do agemu ako hociaka firma , dealeri maju tusim este vacsiu zlavu je to konkretne PALIT 9800GTX+ ktoru tam ty vidis za 4800 ale to je len doporucena cena , nakupna je o cca 10% mensia viem ze konkretne tato karta je vynimka z pravidla (bezne stoja okolo 5k a viac) ale je na sklade , da sa kupit tak som myslel ze s nou v takychto porovnaniach treba ratat a ta karta tam uz od pondelka bola (akurat ty si ju videl za 4800,-) :)
MichiGen
Super clanok od cruxa ako vzdy :) aj vyber hier je dobry a aktualny.
crux2005
presne tak, skôr výnimka, a keďže som bral priemer cien z viacerých obchodov v poslednej tabuľke, tak sa to prejavilo len mierne. Ceny sú proste háklivá záležitosť ...
lkuzman
Pekná recka, Toxic to vyhral a právom.
crux2005
Ja som mal verziu s pamäťou pracujúcou na 1150MHz. Takže si najprv zisti fakty a potom pindaj.
SUBOSVK
fakt je,ze ju mam v PC
Pridať nový komentár
TOPlist