Keď prišla NVIDIA v roku 2018 s novým označením grafických kariet GeForce RTX namiesto rokmi zaužívaného GeForce GTX, hlavnou témou bol ray-tracing v reálnom čase. Novinky z rodiny RTX totiž obsahovali nové RT a Tensor výpočtové jadrá, ktoré majú na starosti akceleráciu tejto výpočtovo náročnej techniky renderovania obrazu. Úlohou "chytrých" Tensor jadier je teda spolupracovať s RT jadrami dosahovať tak optimálne využitie výpočtového výkonu. Jadrá Tensor však dostali ešte jednu úlohu, a tou je nahradiť tradičný anti-aliasing novou technológiou DLSS.
Kým sa však dostaneme k jednotlivým technológiám, v krátkosti si predstavíme súčasnú generáciu grafických kariet NVIDIA RTX 40xx.
NVIDIA RTX 40xx - architektúra Ada Lovelace
Nová architektúra Ada Lovelace prináša výrazne zlepšenia oproti predošlým generáciám grafických kariet RTX, najmä v oblasti ray tracingu (RT) a technológií DLSS, ktorá je úzko spätá s nasadením AI. Nové RT a Tensor jadrá tak ponúkajú v porovnaní s predchádzajúcou generáciou vyšší výkon a efektívnejšie spracovanie AI úloh.
Súčasná generácia dostala naviac SUPER upgrade, ktorý prináša ešte väčší počet výpočtových, RT a Tensor jadier. Napríklad v prípade RTX 4070 SUPER je to nárast o 20% v porovnaní s RTX 4070. Parametrovo sú tak aktuálne SUPER karty niekoľko násobne výkonnejšie v oblasti RT a AI výpočtov v porovnaní s predošlou generáciou kariet RTX, čo je vidno v prehľadnej tabuľke nižšie.
Medzigeneračné porovnanie parametrov RTX 4070 SUPER, RTX3070 a RTX2070, zdroj: nvidia.com
Medzigeneračné porovnanie parametrov RTX 4070 Ti SUPER, RTX 3070 Ti a RTX 2070 SUPER, zdroj: nvidia.com
Medzigeneračné porovnanie parametrov RTX 4080 SUPER, RTX 3080 Ti a RTX 2080 SUPER, zdroj: nvidia.com
Takto masívny nárast výkonu sa musel zákonite prejaviť aj v hernom výkone. A nárasty sú doslova impozantné. Platí to najmä pri nasadení technológie DLSS 3 Frame Generation, ktorá ťaží z novej architektúry Ada Lovelace. Nové grafické karty tak prinášajú medzigeneračný nárast výkonu v násobkoch, ako je vidno na grafe nižšie. Použitá je grafická karta RTX 4070 SUPER v porovnaní s RTX 3070 a RTX 2070.
Z aktuálne najpopulárnejších herných titulov spomeniem Alan Wake 2. RTX 4070 SUPER sa výkonovo pohybuje na úrovni 70 FPS, zatiaľ čo RTX 3070 na ťažko hrateľných 20 FPS. Podobne veľké rozdiely sú aj pri Cyberpunk 2077 v prospech RTX 4070 SUPER - cez 80 FPS vs. 20 - 30 FPS u RTX 3070. Práve tu je vidno obrovský výkonový prínos DLSS 3 Frame Generation, o ktorom si napíšeme v ďalšej kapitole článku.
RTX 4070 SUPER si však výrazne polepšila aj v hrách bez implementovanej Frame Generation. Hoci sa nejedná o troj- či až štvornásobky výkonu ako v prípade nasadenia Frame Generation, nárast výkonu je výrazný, a to aj v porovnaní s nárastom medzi generáciami RTX 20xx a RTX 30xx. Do pozornosti dávam najmä akčnú adventúru s nádhernou grafikou, The Last Of Us Part 1, kde sa výkon RTX 4070 SUPER pohybuje medzi 100 - 120 FPS, zatiaľ čo RTX 3070 medzi 60 - 80 FPS.
Graf porovnania výkonu RTX 4070 SUPER, RTX 3070 a RTX 2070, zdroj: nvidia.com
Porovnateľné výkonové nárasty sa udiali aj pri porovnaní RTX 4070 Ti SUPER a RTX 4080 SUPER s jej predchodcami. Tu sa už podrobnejšie rozpisovať nebudem, avšak masívny nárast výkonu je zrejmý na prvý pohľad.
Graf porovnania výkonu RTX 4070 Ti SUPER, RTX 3070 Ti a RTX 2070 SUPER, zdroj: nvidia.com
Graf porovnania výkonu RTX 4080 SUPER, RTX 3080 Ti a RTX 2080 SUPER
NVIDIA DLSS
Ak sa pohybujete v hernom svete, tak ste iste aspoň okrajovo zachytili pojem DLSS. DLSS (Deep Learning Super Sampling) je technológia vyvinutá spoločnosťou NVIDIA, ktorá využíva strojové učenie a umelú inteligenciu na zlepšenie grafického výkonu a kvality obrazu pri hraní počítačových hier.
Zvýšenie kvality obrazu sa obvykle deje na úkor výkonu alebo naopak, zvýšením herného výkonu je potrebné obetovať kvalitu obrazu, avšak DLSS dokáže poskytnúť vyšší výkon pri zachovaní rovnakej alebo dokonca zvýšenej kvality obrazu oproti temporal aliasingu (TAA). Ako? Je to práve umelá inteligencia, vďaka ktorej je možné scénu renderovať v nízkom rozlíšení a následne vykresliť pomocou inteligentného upscalingu na požadované vysoké rozlíšenie.
Toto bol samozrejme iba veľmi hrubý náčrt, ako DLSS funguje. Táto technológia je tu s nami už od roku 2018 a za ten čas si prešla značným vývojom. Na ďalších riadkoch si rozoberieme historický vývoj a fungovanie jednotlivých verzií DLSS.
História a vývoj jednotlivých verzií DLSS
DLSS 1.0
Píše sa rok 2018 a je to práve NVIDIA, ktorá začala využívať AI, hoci to nebolo také cool ako dnes počujeme pomaly každý deň. Debut prvej verzie DLSS prišiel spolu s grafickými kartami NVIDIA RTX 20xx, ktoré obsahovali špeciálne Tensor jadrá určené na zrýchlenie strojového učenia a AI výpočtov. Prvá verzia DLSS bola zameraná na zlepšenie výkonu tým, že používala techniku super sampling, kde obraz bol najprv vyrenderovaný v nižšom rozlíšení a potom bol pomocou AI upscalovaný do vyššieho rozlíšenia.
Schéma fungovania DLSS v porovnaní s klasickým anti-aliasingom, zdroj: nvidia.com
Táto metóda poskytovala výrazný nárast výkonu, ale občas mala problémy s kvalitou obrazu, ako boli rozmazané detaily alebo artefakty. Nevýhodou bola aj náročná implementácia na strane vývojárov hier a nutnosť "tréningu" AI na superpočítači Saturn V na konkrétnu hru. Podpora v hrách sa tak zastavila na čísle 5, spomedzi ktorých stoja za zmienku najmä Metro Exodus či Battlefield V.
Dôležité však je, že DLSS ako také prinieslo inovatívny prístup k zvýšeniu grafického výkonu bez potreby dodatočného hardvéru, ako boli svojho času rozširujúce karty na fyzikálne výpočty PhysX od spoločnosti Ageia. Tú v roku 2008 odkúpila NVIDIA a fyzikálne výpočty sprístupnila na grafických kartách GeForce.
DLSS 2.0
NVIDIA DLSS 2.0 prišla v roku 2020 a priniesla výrazné zlepšenia. Stále sa jedná o takzvaný supersampling, kde sa scéna renderuje v nižšom rozlíšení a následne dochádza k upscalingu, avšak nová verzia prešla na neurónovú sieť, ktorá sa dokáže učiť zo širšej škály herných scén a poskytuje väčšiu flexibilitu vývojárom hier. Tento tréning umožňuje neurónovej sieti lepšie identifikovať detaily a minimalizovať artefakty pri upscalovaní. Tento prístup výrazne zlepšil kvalitu obrazu v porovnaní s DLSS 1.0, pričom si zachoval významné výkonnostné výhody.
Porovnanie DLSS 1.0 a 2.0, zdroj: nvidia.com
Významnou novinkou boli aj tri rôzne režimy: "Quality", "Balanced" a "Performance", ktoré umožňovali hráčom voliť medzi rôznymi úrovňami vyváženia kvality obrazu a výkonu.
Porovnanie herného výkonu so zapnutým a vypnutým DLSS, zdroj: nvidia.com
Stále tu však zostáva závislosť na podpore zo strany vývojárov hier, avšak výrazne klesla náročnosť implementácie, čo sa prejavilo aj na pomerne širokej podpore v rôznych hrách a aplikáciách. Tých je aktuálne cez 500 (link) - spadajú sem aplikácie s podporou DLSS 2.0, ale aj tie s novšou verziou, pretože obsahujú komponenty z predchádzajúcich verzií. Na spomenutom odkaze si môžete vyfiltrovať podporované aplikácie a hry v jednotlivých verziách DLSS.
DLSS 2.0 je podporované na všetkých grafických kartách GeForce RTX, teda počnúc modelmi 20xx až po súčasnú generáciu RTX 40xx.
DLSS 3.0
Tretia verzia DLSS prišla na scénu v septembri 2022 a od predchádzajúcich dvoch verzií sa výrazne odlišuje najmä novým prvkom - Frame Generation. DLSS 3.0 s využitím Frame Generation zvyšuje až 4-násobne počet snímkov pomocou pohybovej interpolácie. DLSS 3.0 si však zachováva aj schopnosti predošlej generácie, a teda upscalovanie obrazu pomocou neurónových sietí.
Nárast výkonu so zapnutým DLSS 3.0, zdroj: nvidia.com
DLSS Frame Generation využíva na generáciu snímkov 4 vstupné informácie - aktuálny snímok, predošlé snímky, pole vektorov pohybu objektov v obraze generovaným pomocou Optical Flow Accelerator a údajoch z herného enginu. Výsledkom je ďalšia eliminácia nežiadúcich artefaktov v obraze.
Vstupné informácie na tvorbu obrazu pomocou Frame Generation, zdroj: nvidia.com
Keďže DLSS 3.0 Frame Generation využíva novú architektúru Optical Flow Accelerátora, je podporovaná na aktuálnych modeloch grafických kariet RTX 40xx. Taktiež je potrebná podpora zo strany vývojárov hier, avšak je tu ešte jedna výhoda a tou je spätná kompatibilita s DLSS 2.0. Ak teda vývojár implementuje do hry podporu DLSS 3.0, hra bude automaticky podporovať aj DLSS 2.0. Majitelia starších modelov RTX tak môžu využiť aspoň časť vylepšení, ktoré DLSS ponúka.
DLSS 3.0 k dnešnému dňu podporuje viac než 70 aplikácii a hier.
Reflex
Ďalším významným komponentom DLSS 3.0 je Reflex, ktorý má za úlohu znížiť latenciu vo vykresľovaní. Totiž DLSS 3.0, na rozdiel od predchádzajúcich verzií, vytvára nové snímky medzi tými existujúcimi. Tento proces môže pridať mierne oneskorenie, pretože si vyžaduje dodatočné výpočty a analýzu pohybu, čo môže viesť k zvýšeniu latencie. Toto oneskorenie je spravidla zanedbateľné, keďže sa jedná o milisekundy, avšak pri e-športoch či akčných online hrách toto môže byť kritické.
NVIDIA Reflex znižuje latenciu optimalizáciou a synchronizáciou spracovania údajov medzi procesorom (CPU) a grafickou kartou, čím sa zabezpečuje čo najrýchlejšie spracovanie dát. Vo finále tak Reflex znižuje čas, ktorý grafická karta strávi čakaním na úlohy z CPU.
Porovnanie systémového oneskorenia bez a s NVIDIA Reflex, zdroj: nvidia.com
Reflex je naviac kompatibilný aj s technológiou NVIDIA G-Sync, ktorá synchronizuje obnovovaciu frekvenciu monitora s výstupom z grafickej karty, čím sa ďalej znižuje výsledná latencia. Dobrou správou je, že Reflex nie je exkluzívny iba pre RTX radu, ale podporujú ho aj staršie grafické karty GeForce série GTX 900 a GTX 10xx. Tie už síce v dnešnej dobe predstavujú skôr low-end, avšak je to dobrým signálom od NVIDIA pre používateľov, ktorí tak nie sú ochudobnení o novšie technológie umelými prekážkami.
NVIDIA Reflex Analyzer, zdroj: nvidia.com
DLSS 3.5
Najnovším prírastkom do rodiny NVIDIA DLSS je verzia 3.5, ktorá bola predstavená v auguste 2023. Jedná sa tak stále o novinku, ktorá sa postupne dostáva do praxe. DLSS 3.5 sa podobne ako predošlá verzia 3.0 skladá z viacerých komponentov.
Tým hlavným je Ray Reconstruction, ktorý sa zameriava na zlepšenie kvality ray-tracingu. Využíva pri tom modely strojového učenia, ktoré analyzujú ray-tracingové dáta na tvorbu osvetlenia, odrazov a tieňov v scéne. Tradičný ray-tracing je ladený a optimalizovaný pre každú scénu v hre takpovediac ručne, keďže je tento spôsob renderovania mimoriadne náročný. To robí implementáciu ray-tracingu časovo aj finančne náročnou. DLSS 3.5 Ray Reconstrucion využíva na optimalizáciu vykresľovanej scény sieť AI trénovanej na superpočítači. Výsledkom je tak kvalitnejší obrazový výstup s menším počtom artefaktov a vyššou snímkovou frekvenciou v porovnaní s "ručne" ladeným ray-tracingom.
Schéma DLSS 3.5 Ray Reconstruction, zdroj: nvidia.com
Súčasťou DLSS 3.5 je sú aj komponenty Frame Generation a Upscaling, ktoré sa v porovnaní s DLSS 3.0 učia na 5-násobnom množstve dát pre dosiahnutie čo najlepších výsledkov pri rozpoznávaní scény renderovanej ray-tracingom a jej následnom upscalovaní.
Porovnanie výslednej scény z ray-tracingových samplov bez a s DLSS 3.5, zdroj: nvidia.com
Hier a aplikácií s podporou DLSS 3.5 je zatiaľ poskromne. Momentálne sa jedná o tituly Cyberpunk 2077, Alan Wake 2, Portal with RTX a nástroj na renderovanie Chaos Vantage. Nutná je tak opäť implementácia na strane vývojárov, avšak obrovskou výhodou je podpora DLSS pomocou plug-inov v populárnych herných enginoch. To značne uľahčuje implementáciu (DLSS 2 je údajne záležitosťou na "niekoľko dní").
Dobrou správou je opäť spätná kompatibilita nového komponentu Ray Reconstrucion so všetkými grafickými kartami GeForce RTX, vďaka čomu je možné s rozumnými nastaveniami rozbehať ray-tracing aj na starších modeloch grafických kariet RTX - viď predošlý článok.
Kompatibilita jednotlivých verzií DLSS s grafickými kartami NVIDIA , zdroj: nvidia.com
Zhodnotenie, záver
NVIDIA technológiou DLSS ukázala, ako sa dá šikovne využiť ohromný výkon umelej inteligencie a neurónových sietí na výrazné zlepšenie výkonu grafikých kariet v hrách a aplikáciách. Nejedná sa o samotné zvýšenie výpočtového výkonu, ale o jeho čo najefektívnejšie využitie. Vďaka implementácii DLSS si tak viete užiť novšie tituly aj na starších grafických kartách, čo ich robí takpovediac "future proof" a zvyšuje ich hodnotu. Tento krok NVIDIA sprístupniť nové technológie aj na starších GeForce RTX kartách je rozhodne veľmi sympatický a iste si tak získala srdce nejedného zákazníka. Samozrejme si tým NVIDIA posilňuje aj pozíciu na trhu a stáva sa tak atraktívnejšou pre vývojárov. Ostatne, čísla vravia samé za seba - viac než 500 hier a aplikácii s podporou rôznych verzií DLSS (link).
Na záver ešte dodám, že ďalšom pokračovaní článku o technológiách NVIDIA sa bližšie pozrieme na kreatívny potenciál DLSS a možnosť využitia kariet GeForce RTX na lokálne prevádzkovanie a trénovanie vlastných AI modelov. Ten si aj otestujeme pomocou aplikácie ChatRTX a grafickej karty GeForce RTX 4070 Super.
Partnerom projektu o technológiach NVIDIA je spoločnosť Alza, ktorej patrí poďakovanie za poskynutie grafickej karty GeForce RTX 4070 Super.
Pridať nový komentár