SK

Add new comment

Pjetro de
3) CPU su mrtve lebo "nestihaju paralelizovat" ??? Zaujimave, vzdy som si myslel ze problemom dneska je ozaj programovat pre multi-thread a ten 16C32T AMD ThreadRipper na plno nezatazi ani nejeden benchmark, lebo proste jeden proces/aplikacia nedokaze vytazil naplno 16 jadier a 32 vlakien a skutocne vypoctova sila sa ukaze az vtedy, ked tam proste ten benchmark pustim 2x (slovom DVA KRAT) na 8C16T a vtedy je uz zatazene uplne vsetko a vypocita sa toho o 30% viacej ako benchkark pustany ako 1x na 16C32T. A to som pisal o benchmarkoch, nie beznych programoch. Takze jadier je v CPU dnes podla pana CEO nVidie asi malo, preto su CPU mrtve ?!?!? Hmmm zrejme by bolo dobre aspon 128C256T procesor, na taku riadnu paralelizaciu JEDNEHO JEDINEHO procesu. Pan CEO si asi nevsimol, ze GHz vojna skoncila n 2003/2004 NE-uvedenim 4,0 GHz 1-jadierkoveho 1-vlakienkoveho P4 a boli sme v intervale 3-4 GHz a za dekadu sme sa len velmi symbolicky posunuli na interval 4-5 GHz. Keby frekvencia rastla ako v 1995-2005 (75 MHz - 3800 MHz, co je 50-nasobok), dnes v 2017 daaaavno mame low-endove 1/4 THz 1-vlakienkove CPU, high-endove 1/2 THz CPU a schyluje sa k 1 THz vojne !!!!!!! Pan CEO nVidie si asi nevsimol ze posl. takmer 1,5 dekady sa surovy vykon CPU zvysuje hlavne pridavanim jadier (lebo frekvencia uz vyssie ist nemoze a s IPC to tiez uz o moc vyssie nejde, proste zakladne x86/x87 instrukcie uz nezrychli nikto). Ale CPU nie su dnes podla pana CEO dostatocne paralelezovane a treba GPU s 8192 alebo 16384 CUDA (ci SP) a k tomu ziadne CPU. 4) Vykon GPU rastie vyrazne na rozdiel od CPU samotných? Pan CEO nVidie musi byt vazne poruseny. Aky je dnes typicky vypoctovy vykon GPU ??? Myslim v FP32 a pod. vyuzivanym standardnych obvodov (ako Int8, Int16, FP32 a FP64). Takze aky? 100-500 TFLOPs? NIE, cca 25-26 TFLOPS. A to musime mat tisice shaderov (CUDA, streaming processors SP, nazvime si to ako chceme). Ano specializovane obvody pre AI ci TPU (tenzor processing unit) to posunu aj 8-nasobne na 200 TFLOPS. Presne rovnako instrukcne sady v CPU (co je tiez v podstate HW modifikacia pretoze tam na to musia byt obvody) zrazu zvysia vykon pri sifrovani AES napr. 8 nasobne pri Phenom II X6 versus novsi FX 8350/8370 ktory AES podporuje (https://goo.gl/AfS9wi). Alebo ine specializovne instrukcne sady. Proste aj na CPU moze byt nieco zo dna na den 8-nasobne rychlejsie, treba na to specializovnu instrukcnu sadu a sofver ktory ju intenzivne pouziva. Celkovo vykon CPU (ako som v bode 3 vysvetlil musime mysliet kumulativny vykon vsetkych jadier, nie IPC a este myslime klasicke spracovanie instukcii, nie specialne instrukcne sady co hned vypocet zrychlia 8-nasobne) stupol od toho roku cca 2004 rovnako prudko ako vykon GPU (vyuzivanym standardnych obvodov).
TOPlist