Podľa analýzy na serveri RealWorldTech využíva nVidia PhysX pri behu na procesore zastaralé a pomalé x87 inštrukcie, pričom jednoduché použitie SSE inštrukcií by vraj mohlo zrýchliť PhysX na CPU až dvojnásobne.Fyzikálne efekty v moderných 3D hrách - pod týmto si mnohý predstavia PhysX. Pôvodne projekt firmy Ageia, neskôr odkúpenej firmou nVidia, PhysX je ideálnym príkladom ako môže byť užitočný veľký paralelný výpočtový výkon grafických čipov. V hrách, kde je aktivovaná náročná fyzika bez spoluúčasti nVidia GPU, ide výkon strmo dole, keďže sa výpočty prevádzajú iba na CPU, a aj to iba na jednom jadre (základné nastavenie PhysX na CPU - podpora viacerých jadier je na vývojároch hier). Výhoda paralelného spracovania sa aktivuje až pri zapnutí podpory zo strany GeForce grafického čipu.
Podľa analýzy niekoľkých PhysX hier (prostredníctvom Intel VTune profilling tool), ktorú spravil David Kanter z Real World Technologies, má PhysX okrem obmedzenia na iba jedno CPU jadro aj ďalšie. Pri vypnutej akcelerácii cez GPU a pri kalkulácií PhysX efektov cez procesor, sa veľká väčšina kódu vykonáva cez staré x87 inštrukcie. Pritom podľa Kantera neexistuje žiadna technická prekážka, ktorá by bránila použiť rýchlejšie a novšie SSE inštrukcie, už niekoľko rokov odporúčané AMD aj Intel-om. Neobstojí vraj ani argument spätnej kompatibility so staršími procesormi, dokonca softvérové PhysX vrstvy ktoré bežia na konzolách sú veľmi podobné SSE. Použitie SSE by mohlo aj zjednodušiť vývoj hier s PhysX.
Aj na jednom vlákne na CPU by tak mohlo PhysX podľa odhadov bežať približne dvojnásobne rýchlejšie, stačilo by používať namiesto starých x87, nové SSE inštrukcie.
Otázne teda ostáva, či je tento prípad iba chybou v optimalizácii PhysX kódu pre CPU, alebo je to zo strany nVidie zámerné zníženie výkonu PhysX bežiacom na procesore. V druhom prípade by išlo o umelé zlepšovanie pozície GPU pri spracovaní PhysX. Pravdou však ostáva, že nVidia si také niečo so svojou vlastnou technológiou môže dovoliť.
Samozrejme sa patrí vypočuť aj druhú stranu. Ak nVidia odpovie na túto správu, článok doplníme.
Kompletnú analýzu nájdete v pôvodnom článku. Ten odporúčam aspoň prebehnúť, aj napriek vyššej technickej úrovni.
Zdroj: RealWorldTech, Techreport
technar
viperman
Frosty
shajek
shajek
landrower
nManJofo
Frosty
bladejac
RESIDENT
Tronic
Xenon
jerseys