Čip RV670
(očistené jadro RV670 bez chladiča)
Problémy R600 boli hlavne: vysoká spotreba – z toho vyplývajúca vysoká teplota jadra, hlučný chladič a v neposlednom rade aj výkon, ktorý neohromil ľudí, tak ako to očakávali. Tieto problémy si v AMD/ATi uvedomili a preto vznikol RV670. „V“ v názve značí „Value“ - teda cenovo výhodný čip. Výkonom možno zaradiť RV670 do „performance“ triedy ako svojho času známu RV570. Na výkon sa pozrieme v časti „Benchmark výsledky“. Cenou možno čip zaradiť do mainstream kategórie.
Kľúčovým faktom pre vznik RV670 bol výrobný proces. AMD/ATi vsadilo opäť na veľmi mladý half node 55nm proces “55GT” v TSMC, ktorý predstavuje optický shrink 65nm procesu. Prechod bol taký úspešný, že aj pracovníci ATi boli prekvapení. Ďalším pozitívnym vedľajším účinkom bolo, že sa predstavenie RV670 mohlo posunúť o ~2 mesiace dopredu z 1.Q 2008 na 4.Q 2007. Vďaka menšiemu výrobnému procesu, ktorý nemá okrem toho vysokú static power leakage ako 80HS sa výrazne zlepšili tepelné vlastnosti čipu – menšia spotreba a TDP. 400mm^2 obor R600 sa razom zmenšil o viac ako polovičku. Veľkosť jadra RV670 je len 193mm^2 (~ 13,8x13,8mm).
Celkovo bol návrh jadra R600 uprataný. Redundantné tranzistory boli vyhodené a došlo k viacerým optimalizáciám. Prístup k pamäti cache sa urýchlil, shader resolve v ALUs bol vylepšený a zvýšný bol aj geometry shader výkon. Presné čísla, ako je zvykom, AMD/ATi nemenuje. Špekulácie existujú aj o tom, že frekvencia ALUs je vyššia ako zbytok čipu – išlo by teda o “shader doménu” ako ju poznáme z G80. Či je to pravda nevieme. Vylúčiť to ale nemôžeme, nakoľko vlastní AMD/ATi už dlhšie podobný patent.
RV670 obsahuje rovnaký počet sampler, aritmetických a rasterizačných jednotiek ako R600, nakoľko predstavuje jeho shrink s určitými vylepšeniami. Vyjadrené v číslách – 4 sampler jednotky, 320 (64x5D ALUs) stream processing units a 4 quady rasterizačných jednotiek. Vďaka menšiemu výrobnému procesu môžu pracovať na HD 3870 s 11% vyššou frekvenciou – 775MHz. Tesselačná jednotka samozrejme ostala v desinge. Počet tranzistorov napriek tomu klesol. Zo 700 miliónov na 666 miliónov :-) (tu si môže každý doplňiť svoj vlastný vtip).
Technické parametre čipu "RV670" | |
Výrobný proces: |
55nm @ TSMC |
Počet tranzistorov: | ~ 666 miliónov |
Plocha a rozmery jadra: | 193 mm2; 13,8 x 13,9 mm |
Obal jadra: | "Flipchip" |
Základná konfigurácia: | 16 textúr/ 16 pixelov/ 32x Z |
Zbernica: | 256-bit 8 x 32-bit |
Podpora Direct3D: | 10.1 |
Pripojenie k systému: | PCI-Express 2.0 x16 |
Výstupy: | 2x Dual-link DVI, HDMI, HDCP |
Do vienka dostal RV670, ako prvý desktop consumer čip, podporu double precision IEEE 754. Presnejšie povedané 4/5 (256 SPUs) všetkých ALUs – tie “chudšie” môžu počítať s Double precision (DP) = 64bit presnosť spracovania všetkých dát so ¼ rýchlosťou. Preto klesne MADD aritmetický výkon na 1/5 (99,2 GFLOPs). Pokiaľ počítajú 4/5 ALUs s DP môže 1/5 = tie “výkonnejšie” počítať so single precision (SP). V tomto “mixed” móde je aritmetický výkon okolo 200 GFLOPs. Veľkú výhodu môže mať DP pre vedcov a iné skupinky ľudí, ktorý potrebujú 64bit presnosť pre svoje (GPGPU) aplikácie, nakoľko nie je 32bit presnosť dostačujúca.
Zmenšená voči R600 bola jedine šírka zbernice. V prípade R600 bol kladený dôraz na FP-16 výkon a tomu bol podriadený celý návrh. Napríklad: sampler jednotky, šírka zbernice, ALUs. Počaš života nepomohla 512bit zbernica R600. V budúcnosti sa to pravdepodobne zanedbateľne zmení. To už bude ale nezaujímavé, nakoľko aj výkon bude nedostačujúci. RV670 má preto “len” 256bit (512bit interný, dvojsmerný RingBus) zbernicu, ktorá je však mierne vylepšená a ďalej zoptimalizovaná. Hlavne arbiter jednotky boli mierne prepracované. V spojení s podporovanou GDDR 4 pamäťou má jadro vo väčšine prípadov dostatočnú priepustnosť k dispozícii aj preto, že vie lepšie narábať s priepustnosťou. Len v extrémnych situáciách má R600 s viac ako 100 GB/s priepustnosťou navrch.
Miesta na jadre ešte stále ostalo, tak prečo nepridať UVD (Unified Video Decoder), ktorý R600 neobsahuje ? UVD zaberajúci na 65nm čipoch RV630/610 len 4,5mm^2, urýchluje tri hlavné HD video formáty H.264, VC-1 a MPEG2. Vďaka tomu odbremeňuje CPU od výpočtov. V prípade RV670 dostal nový názov “UVD+” a podporuje rozlíšenia do 2560x1600.
Do čipu bola pridaná aj podpora najnovšieho Direct3D 10.1, ktoré bolo len nedávno vydané spolu so Service Packom 1 pre Windows Vista. Direct3D 10.1 predstavuje mierne vylepšené Direct3D 10, zjednodušuje programovanie vývojárom a podporuje nové rendering features. Pôvodne mali byť tieto features integrované už do Direct3D 10. Kvôli tlaku iných strán, hlavne nVidie sa MS rozhodol pre takýto posun.
Hlavné vylepšenia Direct3D 10.1 sú:
- TextureCube Arrays which are dynamically indexable in shader code
- The ability to select the MSAA sample pattern for a resource from a palette of patterns, and retrieve the corresponding sample positions
- The ability to render to block-compressed textures
- More flexibility with respect to copying of resources
- Support for blending on all unorm and snorm formats
Zmeny to nie sú veľké, avšak umožňujú jednoduchšie vytvoriť content. Napr. Cube Map Arrays sa dajú využiť veľmi dobre na Global Illumination. Konečne by mal byť podporovaný MSAA v Deffered Rendering enginoch ako UT3 a pod. bez hackov zo strán nV/ATi.
Direct3D 10.1 prináša automaticky so sebou nový Shader Model. Tentoraz vo verzii 4.1. Zaujímavý je určite aj fakt, že D3D 10.1 ako prvý prikazuje podporu MSAA s minimálne 4 samplami pre všetky 32 aj 64bit formáty. Okrem toho majú 2x, 4x, 8x a 16xMSAA predpísané pozície samplov. Vyžadovaná je aj podpora FP-32 filteringu v TMUs a Int16 blendingu v ROPs.
Ak sa pozrieme na konkurenčné čipy od nVidie – G8x a G9x, zistíme, že im úplné podpora D3D 10.1 chýba. G92 nikdy nemal byť D3D 10.1 čip a teda ani ďalšie jeho deriváty nemajú túto podporu. Prečo sa tak nVidia rozhodla ? Nevieme to s úplnou 100% istotou, dá sa však predpokladať, že nV nepripisovala D3D 10.1 taký význam a tieto tranzistory radšej zainvestovala do niečoho iného. Konkrétne do “custom tranzistorov”, ktoré sú ručne navrhnované, upravované, aby Shader Core mohol pracovať na svojich vysokých frekvenciách. Pre lepší obraz o situácii ešte treba vedieť, že G92 sa nVidii nevydaril, tak ako chceli, obsahuje pomerne veľa tranzistorov, nedosahuje očakávané pracovné frekvencie. Okrem toho si ním nV strelila do vlastného kolena, keď predstavila GeForce 8800GT.
Ešte zreteľnejšie je vidieť ako nVidii nezáleží na podpore D3D 10.1 a snaží sa ho rôznymi cestami bojkotovať v rozhovore s CEO Cryteku - Cevat Yerli:
"We pride ourselves on being the first to adopt any important new technology that can improve our games so you would expect us to get with DX10.1 right away but we've looked at it and there's just nothing in it important enough to make it needed. So we have no plans to use it at all, not even in the future.”
(Crytek je v nVidia TWIMTBP programe)
a v nVidia dokumente o D3D 10.1
“DirectX 10.1 is a minor extension of DirectX 10 that makes a few optional features in DirectX 10 mandatory”
Je teda logické, že AMD/ATi sa snaží robiť v tomto smere osvetu. Na svojich stránkach zverejnila dokument o Direct3D 10.1. Prednedávnom bolo zverejnené aj D3D 10.1 techdemo pre HD 3000 grafické karty. Techdemo má názov “Ping Pong” a v hlavnej úhlohe sú okrem loptičiek - Global Illumination, Dynamic Ambient Occlusion a MSAA s Deferred Shadingom.
Majitelia Radeon HD 3000 karty s operačným systémom Windows Vista a SP1 si môžu stiahnuť a nainštalovať timedemo zo stránky AMD/ATi. Pre nás ostatných bolo vytvorené video, ktoré si môžete buď stiahnuť, alebo pozrieť na YouTube.com.
(klikni pre zväčšenie)
Ako to vyzerá s D3D 10.1 hrami ? V najbližšom roku neočakávam väčšie množstvo hier, ktoré by využívali tento najnovší API (Application programming interface), nakoľko nVidia ešte nemá čip s plnou podporu. Zmení sa to pravdepodobne až s príchodom nového čipu GT200. nVidia bude nútená podporovať D3D 10.1, nakoľko Direct3D 11 bude oficiálne predstavené až s ďalším operačným systémom Windows Seven (7). MS hovorí oficiálne až o roku 2010. Väčšie množstvo D3D 10.1 hier, keď vôbec, očakávam preto v roku 2009.
S novinkami v čipe RV670 ešte neskončíme. Ako vidieť aj v tabuľke, čip RV670 podporuje najnovšiu verziu zbernice PCI-Express 2.0 zavedenú s Intel X38 čipsetom.Táto prináša zdvojnásobenie priepustnosti oproti PCI-Express 1.1 na 16GB/s pre oba kanály. Niečo podobné sa uskutočnilo aj v minulosti s AGP 4x – 8x. Na rozdiel od nVidie, hovorí AMD/ATi vo svojich dokumentoch až o 10% navýšení výkonu, vďaka vyššej priepustnosti novej zbernice. Na rozdiel od chýrov, poskytuje PCI-Express 2.0 rovnako ako staršia verzia maximálne 75W pre grafickú kartu. RV670 aj PCI-Express 2.0 sú spätne kompatibilné so staršími verziami, teda ani majitelia dosiek s PCI-Express 1.0, 1.1 slotom sa nemusia obávať o nekompatibilitu. Tú spôsobujú skôr (VIA) čipsety.
Na ohlasy nVidie o Quad-SLi a Tripple-SLi musela samozrejme zareagovať aj AMD/ATi a poskytnúť podobné riešenie. Výsledkom je podpora “CrossFire X” v čipoch RV670. Jedná sa v podstate o CrossFire, ktoré podporuje zapojenie viacerých – dvoch, troch a štyroch čipov.
Pre dual-CrossFire zapojenie dvoch čipov stačí jeden CF mostík. CF mostíky sa veľmi podobajú na nVidia SLI mostíky, sú len širšie a s nápisom “CrossFire”. Pre zapojenie troch čipov (kariet) je nutné využiť oba mostíky, aby boli všetky tri karty navzájom prepojené. Prvý čip s druhým, druhý s tretím. V prípade Quad CF pozostávajúceho zo štyroch kariet, ktoré je v 99% možné len zo štyroch Radeon HD 3850, je princíp zapojenia podobný ako v prípade troch kariet (čipov). Technicky by sa dali zapojiť aj štyri HD 3870, problém tu však nastáva pre dvojslotový chladič. Nie všetky základné dosky majú 8 slotov, z ktorých sú štyri PCI-Express. (výnimka existuje od spoločnosti Foxconn) Pre zapojenie dvojčipových kariet Radeon HD 3870X2 do CF stačí jeden CF mostík.
V ATi si zobrali spotrebu čipu RV670 k srdcu, preto obsahuje aj feature s názvom “PowerPlay”. PowerPlay je názov pre ďalšiu generáciu power management technológie, teda ekvivalent k Intel Speed Step na GPUs, ktorá bola doposiaľ integrovaná len do mobilných Radeon čipov pre notebooky. Dovoľuje dynamické zníženie frekvencie jadra, zníženie pracovného napätia a deaktiváciu výpočtových jednotiek, pokiaľ nie je potrebný maximálny výkon. O tom rozhoduje grafický ovládač, lebo vie zistiť vyťaženie jadra. Výsledkom je veľké zníženie spotreby v 2D režíme. Medzistupňom je nastavenie pre tzv. "light gaming" v ktorom pracuje len časť výpočtových jednotiek. Okrem toho garantuje AMD/ATi, že PowerPlay bude pracovať vždy synchronizovane s Vista power management profilmi.
Toto všetko teda získate v čipe RV670. Aby si ľudia nespájali nový RV670 so starým R600, nakoľko nebol najlepším čipom v histórii, bola zavedená nova séria Radeon HD 3000. RV670 ako najvýkonnejší čip patrí do Radeon HD 3800 sérii. Ako ste si mohli všimnúť, označenia XT, Pro vypadli a boli nahradené číslami. xx70 je ekvivalent k XT a xx50 k Pro. Vidieť tu vplyv od AMD, ktorá takéto označenia používa už dlhšie pre svoje procesory.
amd_sk
Wild
A2C
GABO
palee
Rincewind
Pavel Čech
miseno
baqq
quicky
Laci
crux2005
Fragrance
quicky
quicky
lacikaboss
mefi
A2C
lkuzman
GABO
mefi
GABO
cpy
mefi
Gudas
r1z1ko
crux2005
GABO
mefi
srewq