Phenom či Athlon, alebo ako veľmi záleží na L3 cache?

AMD má s novými 45nm procesormi vynikajúcu ponuku, ktorá pokrýva priestor od 30€ až po 170€. Množstvo modelov je nahustených cenovo tesne vedľa seba, často je problém aj pre technicky zdatnejších vyznať sa ktorý procesor je na daný účel najvhodnejší. V dnešnom krátkom článku porovnáme v mnohých známych testoch dva rovnaké, trojjadrové procesory, ktoré sa líšia iba prítomnosťou, resp. absenciou L3 cache. Je taká dôležitá, aby bolo treba za ňu priplácať?

Úvod

Čo je, a na čo vlastne slúži cache u procesorov?

Pamäťová hierarchia u desktopových počítačov by sa dala opísať nasledovne – od najlacnejších a najpomalších pevných diskov/SSD s kapacitami v stovkách GB, pokračujúc drahšími a rýchlejšími RAM pamäťami v kapacitách po GiB a končiac najrýchlejšími ale aj na výrobu najdrahšími cache pamäťami s kapacitami od niekoľkých kiB po niekoľko MiB. V skratke by sa dalo povedať, že cache u procesorv slúži na to, aby jadrá spracúvavajúce inštrukcie nad určitými dátami nemuseli siahať do pomalých a vzdialených pamätí (RAM). Namiesto toho sú potrebné dáta kopírované do cache niekoľkých úrovní, ktoré sú priamo na jednom kuse kremíka spolu s exekučnými jednotkami procesora.

Moderné procesory majú dnes trojúrovňovú cache, teda pamäť procesora je rozdelená do troch „levelov“, alebo L1, L2 a L3 ako ich bežne poznáme. 45nm AMD procesory majú dva krát po 64kiB L1 cache, pre dáta a inštrukcie. Druhá úroveň cache je o veľkosti 512kiB, opäť pre každé jedno z jadier. Tieto cache pracujú na frekvencii procesora. Posledná úroveň je spoločná pre všetky jadrá, je najväčšia a tiež zaberá podstatnú časť plochy jadra. AMD Phenom procesory majú 6MiB L3 cache, ktorá je v osobitne taktovanej časti nazývanej aj UnCore, či CPU-NorthBridge.



Existujú dva princípy funkcie cache – exkluzívna a inkluzívna. AMD využíva u svojich procesorov exkluzívnu cache, čo znamená že nižšia vrstva pamäte neobsahuje dáta vyššej vrstvy. Zrejmá je výhoda lepšieho využitia kapacity, nevýhoda sa však skrýva pri tom, keď jedno jadro kontroluje, či sa rovnaké dáta nenachádzajú v cache iných jadier – u exkluzívnom prístupe sa vo veľkej L3 cache nenachádzajú kópie dát z L1 a L2 ostatných jadier, jedno jadro sa teda musí „pozrieť“ postupne ku všetkým ostatným jadrám, až potom môže vykonať ďalšiu operáciu (spracovať dáta, vyžiadať dáta z RAM, ...). Intel využíva inkluzívnu cache, teda existujú kópie dát z L1 v L2, a opäť z L2 vo veľkej L3 cache. Ak sa teda určité dáta nenachádzajú v L3 cache, je istota že sa nebudú nachádzať ani u ostatných jadier, teda sa vyhľadávanie v ich cache preskočí.

Ako je architektúra cache efektívna sa dá vyjadriť pojmami cache hit a chache miss. Požiadavky na dáta, ktoré môže obslúžiť daná cache priamo sa nazýva cache hit, ak daná cache tieto dáta neobsahuje a musí ich vyžiadať z pamäťových prostriedkov nižších úrovní sa nazýva cache miss. Je zrejmé, že cache miss bude zavádzať oneskorenie a teda aj zníženie výkonu.
S akou efektivitou pracujú jednotlivé cache procesora je možné zistiť nástrojom PerfMonitor od tvorcov známeho programu CPU-Z.



Ďalším dôležitým pojmom súvisiacim s cache pamäťou, je jej asociativita (associativity). Zjednodušene povedané, asociativita udáva, na koľko miest v cache môžu byť kopírované dáta z hlavnej pamäte. Pokiaľ procesor môže vybrať akúkoľvek pozíciu pre dáta do cache, je táto nazývaná ako plne asociatívna (fully associative). Existuje aj extrém z druhého konca, keď dáta z pamäte môžu byť kopírované iba na jedno miesto v cache – vtedy sa jedná o direct mapped cache. V desktopových procesoroch sa využívajú cache opisované ako n-asociatívne, teda existuje konkrétny počet miest v cache, kde môžu byť dáta kopírované. 2-way associative je napríklad L1 cache u dnešných AMD procesorov, čo znamená že akákoľvek pozícia v hlavnej operačnej pamäti môže byť kopírovaná na 2 pozície v tejto cache. Vynikajúco to ilustruje obrázok z on-line encyklopédie Wikipedia:



Čím je číslo asociativity vyššie, tým lepšie sú aj hodnoty cache hit, no na druhej strane sa zas predlžuje čas, kedy sa tento väčší počet miest v cache kontroluje. Viac asociatívna cache nám teda zlepšuje cache hit, ale zas aj zvyšuje latenciu.

AMD využíva 2-way associative L1 dátovú aj inštrukčnú cache, čo zabezpečuje nízku latenciu. Pre kompenzáciu horších hodnôt cache hit je zvýšená kapacita (oproti Intelovskej L1 cache) na 64kiB pre dátovú aj inštrukčnú cache.



Súčasná ponuka procesorov od AMD zahŕňa modely s jedným až štyrmi jadrami, resp. s L3 cache a bez nej. Pri uvádzaní 45nm Phenom-ov boli chvíľu na trhu aj čipy s 4MiB L3 cache namiesto 6MiB (Phenom II X4 8xx), no tie sa s postupne zlepšujúcou sa výrobou dnes už u Globalfoundries celkom vytratili z trhu. Máme tu teda modelový rad Phenom II (X2, X3 a X4) s 6MiB L3 cache, Athlon-y II (X3 a X4) s rovnakou štruktúrou L1 a L2 cache ale bez L3 cache a nakoniec Athlon-y II X2 a jeden Sempron, ktoré majú rovnakú L1 cache, dvojnásobnú L2 cache (2x1MiB) a žiadnu L3 cache.

Veľkosť jadra procesorov Phenom II je príliš vysoká na to, aby bolo možné tieto predávať ako konkurenciu pre Intelovské Pentium DualCore a Core2Duo, preto sa firma rozhodla vytvoriť tieto jadrá „osekané“ o veľkú L3 cache. Je jasné, že takýto krok podstatne zlacní výrobu ale na druhej strane môže mať aj veľký a citeľný dopad na výkon v určitých aplikáciách. AMD z časti kompenzuje tento fakt už tradične vynikajúcou cenou za veľký počet jadier (štvorjadro už za 90€, kto by to bol kedy tušil!).





Aký konkrétny vplyv na výkon v moderných testoch, aplikáciách a hrách má absencia L3 cache sa pokúsim zodpovedať v dnešnom článku. Ďalšiu stranu prosím...

Komentáre (18)
AmOK
Strucne a jasne. Uvod trosku tazky, ale to je ok. Aspon som potrapil zavity. Nemam rad recenzie, testy na 20 stran s 100 tabulkami... Btw, len sa potvrdilo, co som si o L3 cashi Phenoma II myslel. Na bezne pouzivanie zbytocnost. Skoda, ze si nezmeral spotrebu pri rovnakej voltazi a pri plnej zatazi v teste, kde je L3 dobre vytazena. Asi by to spravilo relativne vela wattov oproti malemu rozdielu v idle.
Broslowski
..Super citanie, clanok na urovni, myslim ze vela ludom pomoze pri vybere cpu, ta l3 cache fakt nic moc cakal som ze to spravi viac:)
hvk
super clanok,potvrdil presne to,co som si myslel,ze athlon II si so svojou "len" L2 cache uplne vystaci oproti rovnako taktovanemu phenomu II a za podstatne nizsiu cenu....
frcko73
Super clanok....mnohym pomoze a otvori oci....Dakujem.
adun
este by som uvital spravit aj test phenom/athlon/core i3/core i5, ale to chcem asi vela co :D
roob
v desktope mam AII x4 620 2,6GHz (13x200). Je to vyborny procesor, do domacej zostavy uplne postacujuci. Pretaktoval som ho zatial na 15,5x200=3100MHz, ale pouzitam ho momentalne na def. frekvencii, lebo je ot uplne zbytocne. Ak pridu aplikacie, ktore uz na def. nebudu stihat, tak ho taktnem. V clanku autor dobre pise, usetrit na cpu, dat do vga. Do pracovneho pc by som ale volil PhII x4 945 3GHz.
roob
aha, tak opravujem, kukam ceny, a 955 je len o 9€ drahsi. Neoplati sa teda 945.
matelkoxxl
fakt dobre citanie a poucne...nie rozsiahle, ale tak akurat.palec hore za to :-)
PatrikL
pekné aspoň máme čo linkovať keď budeme presviedčať ľudí že x3 425/435 je dobrý cpu a že sa viac-menej oplatí viac ako nejaké 2-jadro :)
flanker
škoda té spotřeby, šlo by dodatečně naměřit spotřebu s rovnocenným napětím (např 1.325V) ? Ona totiž byla dána volná ruka tvůrců BIOSů a tak často s enapětí liší kus od kusu a také někdy dle verze BIOSu.
amd64
dobry clanok, aspon vidno aky je v reali rozdiel. mohli by tu byt viacero takychto clankov :)
adun
este by som uvital spravit aj test phenom/athlon/core i3/core i5, ale to chcem asi vela co :D
AmOK
Toto je test ciste len o fungovani, vyzname L3 cashe a vhodnom vybere AMD procaku, ked ma niekto dilemu. Aj sa tak ten clanok vola. Ak potrebujes porovnat vykon roznych procesorov v roznych aplikaciach, tak staci pozriet AnandTech a budes mat jasno. http://www.anandtech.com/bench/default.aspx?b=2&c=1
lkuzman
Peťo vďaka, zistil som že procák čo som dávnejšie kúpil mi vlastne netreba, keďže som bežný user, podpriemerný gejmer a bývalý oc-er.
AmOK
Lubo (dufam, ze navadi), to mas este dobre, oproti ludom co si kupia kombicko auto a potom zistia, ze vozit niet co a v meste sa parkuje lepsie s nejakym krpcom... :D (joke)
Nickk
"toto naša vláda chcela!" :) niečo také som hľadal THX
Ján Kurej
Pekne spracovana recenzia. cg
maladaptiv
Veľmi pekný článok.
Pridať nový komentár
TOPlist