Obe pochádzajú od AMD, obe majú osem Jaguar jadier a obe majú integrovanú Radeon GPU. Napriek tomu sa tieto custom APUs od seba líšia...
Chipworks sa pozrel bližšie na custom APU (alebo SoC) jadrá nových herných konzol a odhalil, že Microsoft mal vyšší cenový limit pre APU ako Sony - Xbox One APU má plochu 363 mm2, zatiaľ čo PlayStation 4 APU má 348 mm2.
Obe osahujé podobné osem jadrové Jaguar CPU, pozostávajúce z dvoch quad-core CPUs. Väčšie rozdiely sú v implementovanom AMD Radeon GPU, založenom na Graphic Core Next architektúre. Microsoft sa rozhodol pre 2 geometry engines, 12 Compute Units (CUs) a 16 ROPs. Sony na druhej strane sa rozhodol pre 2 geometry engines, 18 CUs a 32 ROPs. PS4 APU má teda 1,5x viac CUs a 2x ROPs ako Xbox One APU. Napriek nižším pracovným frekvenciám má PS4 APU vyšší grafický výkon.
Ako sa však podarilo Sony implementovať viac CUs a ROPs do APU pri nižšej celkovej ploche tohto monolitického jadra? Jednoducho, rozhodli sa proti implementácii eSRAM do jadra.
Technické špecifikácie jednotlivých APUs
Xbox One | PlayStation4 | |
Výrobca APU | AMD | |
Výrobný proces | 28 nm (28HP) u TSMC | |
Plocha jadra | 363 mm2 | 348 mm2 |
Počet tanzistorov | ~ 5 miliárd | neznámy počet |
CPU | 8 jadier, 8 vlákien (AMD Jaguar architektúra, x86, 64 bit) 1,75 GHz, 4 MB L2 cache | 8 jadier, 8 vlákien (AMD Jaguar architektúra, x86, 64 bit) 1,6 GHz, 4 MB L2 cache |
GPU | Radeon HD založené na GCN architektúre, 2 geometry engines, celkovo 14 CUs, 12 aktívnych, 768 stream procesorov, 16 ROPs, 256 bit zbernica, 853 MHz, 1,31 TFLOPs aritmetický výkon | Radeon HD založené na GCN architektúre, 2 geometry engines, celkovo 20 CUs, 18 aktívnych, 1152 stream procesorov, 32 ROPs, 256 bit zbernica, 800 MHz, 1,84 TFLOPs aritmetický výkon |
SRAM | 32 MB sSRAM (celkovo 204 GB/s) | - |
RAM (externá) | 8 GiB DDR3 (68,3 GB/s) | 8 GiB GDDR5 (176 GB/s) |
Obe APUs majú 256 bit širokú zbernicu, pozostávajúcu zo štyroch 64 bit kanálov. V prípade externej pamäte sa Sony rozhodlo pre GDDR5 RAM, pracujúcu na 5,5 GHz (efektívne). Microsoft išiel viac konzervatívnou cestou a rozhodol sa pre lepšie dostupnú DDR3 pamäť, pracujúcu na efektívne 2133 MHz.
Aby sa vykompenzovala nižšia priepustnosť, má Xbox One APU priamo v jadre 32 MB eSRAM. Táto pamäť je dostupná v 8 MB kusoch a poskytuje celkovo 204 GB/s priepustnosť (102 GB/s v oboch smeroch). eSRAM je navrhnutá pre GPU prístup, a preto musí byť v prípade CPU prístupu skopírovaná časť eSRAM do externej RAM.
eSRAM ale nie je cache ako v prípade Intel Crystalwell. Táto pamäť je mapovaná do špecifického adresového rozsahu pamäte. Na rozdiel od eDRAM v Xbox 360, môže eSRAM Xbox One uschovávať viacej ako len Z-buffer alebo render target. Uschovaný môže byť v podstate každý typ povrchu, bufferu, ktorý je prístupný GPU (G-buffer, Z-buffer, shadow buffer atď.). Vývojári by sa mohli tiež rozhodnúť uschovať dôležité textúry v eSRAM alebo hocičo iné, čo je pre aplikáciu dôležité. Je dokonca možné rozdeliť povrchy medzi externou DDR3 RAM a eSRAM.
Xbox One APU
Vďaka tomu by sa mala jednoznačne znížiť zaťaženosť pamäťovej zbernice, ktorá má k dispozícii len okolo 68 GB/s. Microsoft zverejnil, že dostupná priepustnosť k eSRAM je niekde okolo 150 GB/s (po rôznych stratách) - zhruba rovnako veľa má k dispozícii zbernica PS4 s GDDR5 pamäťou. Rozdiel je, že túto priepustnosť máte len k tým najdôležitejším údajom na Xbox One. Priepustnosť sa ale nezdá byť najväčší problém.
Ako som spomenul, Microsoft má nie len menej CUs, ale aj polovičný počet ROPs oproti Sony APU. ROPs (render output unit) sa starajú, ako názov napovedá, o finálny výstup pixelov a ich dôležitosť narastá s vyšším rozlíšením a väčším počtom post-processing efektov. AMD odporúča pre "cieľové rozlíšenie" týchto konzol - 1080p, aspoň 32 ROPs. ROPs sú dôvodom, prečo nájdete v mnohých recenziách zmienku o rozdiely vo finálnom rozlíšení medzi Xbox One a PS4. Xbox musí najprv vykresliť obraz v nižšom internom rozlíšení a ho následne interpolovať do 1080p. Preto zaznamenal Microsoft aj vyšší nárast výkonu pri zvýšení pracovnej frekvencie GPU z 800 MHz na 853 MHz ako v pri pridaní 2 CUs. ROPs pracujú na frekvencii GPU a tým sa zníži ich limitácia, zatiaľ čo pridanie 2 CUs len zvýši aritmetický výkon.
Na jednotlivých obrázkoch ďalej vidieť, že obe APUs majú väčší počet dostupných CUs ako je počet aktívnych CUs. PS4 APU obsahuje 20 CUs, z ktorých je 18 aktívnych. Obdobne na Xbox One APU je dostupných 14 CUs z ktorých je 12 aktívnych.
PlayStation 4 APU
Dôvodom pre tento krok je zvýšenie počtu funkčných APUs pri výrobe (yields). Počet APUs, ktoré majú všetky CUs aktívne, je určite menej ako tých, ktoré majú 1, 2 alebo viacej CUs nefunkčné. Ak sú na APU maximálne 2 CUs nefunkčné, je možné tieto deaktivovať a ho následne predať (v prípade, že zvyšné jednotky sú plne funkčný). Takýto postup je možné vidieť už dlhšiu dobu pri výrobe komplexných CPUs a GPUs.
Z jednotlivých zistení vyplýva, že Microsoft skončil s takouto GPU konfiguráciou nie z dôvodov šetrenia, ale z dôvodov dostupnosti komponentov. DDR3 pamäť je oveľa lepšie dostupná a vo väčšom množstve ako vysoko taktovaná GDDR5 pamäť. Je pochopiteľné, prečo sa v procese plánovania Microsoft takto rozhodol. Uvediem pár čísel pre lepšiu názornosť. Sony predalo vyše 2,1 miliónov PS4 po celkom svete. To je vyše 33 miliónov GDDR5 čipov alebo vyše 16 petabajtov RAM. Ak by sa Sony a Microsoft rozhodli pre použitie GDDR5 pamätí, je veľmi pravdepodobné, že by sa ich dostupnosť výrazne zhoršila.
Zdroj: Chipworks - Xbox One, PlayStation4, Anandtech
Shatterhand
crux2005
Shatterhand