AMD erbjöd en smygtitt in i RDNA 4 på CES 2025 och bekräftade ankomsten av Radeon RX 9070 XT och RX 9070, men gav inte ens en passande kommentar om den nya arkitekturen under den faktiska keynoten.
Företaget vidhöll dock att mer information om RDNA 4 och de nya Radeon GPU:erna skulle komma snart, och här är vi nu.
Idag presenterar AMD RDNA 4 och de nya Radeon RX 9070-seriens GPU:er. RX 9070-serien kommer att finnas officiellt tillgänglig i butikerna från och med den 6 mars och prestandagranskningar kommer dagen innan.
AMD RDNA 4: Tillbaka till en monolitisk design
RDNA 4 bygger vidare på de mål som AMD satte upp med RDNA 3. Enligt AMD är RDNA 4 utformat för att tillgodose tyngre arbetsbelastningar i spel med fokus på förbättrad rasterprestanda och effektivitet.
Sedan tillkommer de sedvanliga förbättringarna av ray tracing-pipelines samt förnyat fokus på AI-funktioner och mediaavkodning/avkodning.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones
I RDNA 3 introducerades en chiplet-design för GPU:er med inspiration från Ryzen-processorer. Här såg vi separationen av minnescache-dies (MCD) från grafikberäkningsdies (GCD).
Med RDNA 4 går AMD dock tillbaka till den traditionella monolitiska designen. Komponenterna är i princip desamma, men det finns inga MCD-GCD-sammankopplingar eftersom minnet och beräkningen nu är direkt sammankopplade via Infinity Cache.
RDNA 4 GPU, Radeon RX 9070 XT i det här fallet, har fyra shader-motorer med åtta arbetsgruppsprocessorer (WGP) vardera. Varje WGP består av totalt åtta beräkningsenheter (CU:er), vilket ger totalt 64 CU:er.
AMD säger att de nya beräkningsenheterna nu är mer kapabla än någonsin och möjliggör förbättrad ray tracing, dubbelt så hög peak throughput, stöd för de senaste matrisaccelerationsfunktionerna med bredare stöd för numeriska format.
Nytt för RDNA 4 CU, och något som vi har sett med Tensor-kärnorna i Nvidias Ampere-arkitektur, är stöd för strukturerad sparsamhet som möjliggör snabbare matrisoperationer, särskilt i fall där många av vikterna är noll.
Vi får också se förbättringar av minnessubsystemet. L2-cachen får en ökning från 6 MB i RDNA 3 till 8 MB i RDNA 4 medan Infinity Cache uppgraderas till 3:e generationen men sjunker till 64 MB från 96 MB i RDNA 3.
AMD fortsätter att förlita sig på GDDR6-minne med den nya generationen. Både RX 9070 XT och RX 9070 erbjuder ett 384-bitars 16 GB GDDR6-minnesgränssnitt som är klockat till 20 Gbps för en effektiv bandbredd på 640 GB/s. Detta är mycket lägre än den 960 GB/s bandbredd som RDNA 3 erbjöd, men AMD säger att RDNA 4:s videominnesspecifikationer valdes noggrant för att stödja nuvarande och framtida titlar.
Förbättrat stöd för mediamotor och flip-metering av hårdvara
Videokodning var ett av de största problemen med RDNA 3, och AMD utlovar betydande förbättringar i det här avseendet. Företaget utlovar stora förbättringar i H.264- och AV1-kodning och mindre blockeringsartefakter för samma datamängd.
Förbättringarna gäller även videoavkodning, med minskad strömförbrukning och ökad prestanda vid avkodning av format som AV1 och VP9.
Radiance Display Engine förbrukar nu mycket mindre ström i FreeSync-konfigurationer med dubbla bildskärmar. Nytt är också stöd för hardware flip queue i Windows Display Driver Model (WDDM) 3.0 för videouppspelning.
Detta frigör CPU-resurser genom att avlasta bildschemaläggningen till GPU:n. MFG-tekniken (multi-frame generation) i Nvidia Blackwell GPU:er bygger också på hårdvaruflippmätning.
En titt på beräkningsenheten RDNA 4
Till att börja med skiljer sig inte strukturen i en RDNA 4 CU så mycket från vad vi har sett med RDNA 3. Det finns dock prestanda- och effektivitetsförbättringar i var och en av CU-komponenterna.
WMMA-operationer (Wave Matrix Multiply Accumulate) har förbättrats för att uppfylla kraven i den nya hårdvaran. Scaler-enheterna har uppgraderats för att hantera Float32-operationer. Schemaläggaren kan dela upp och bearbeta en stor beräkningsarbetsbelastning i delade och namngivna barriärer.
AMD säger att RDNA 4 är byggt för att tillgodose nya renderingstekniker som utvecklare använder i dagens spel. Medan uppskalning har varit på modet, kräver effektiv path tracing ML-acceleration som en del av själva renderingsprocessen och inte som en eftertanke.
Strålningsacceleratorer i RDNA 4
RDNA 4 erbjuder 64 strålacceleratorer av 3:e generationen i RX 9070 XT. Strukturen för en strålaccelerator i RDNA 4 liknar den i RDNA 3 men innehåller en extra intersektionsmotor för 2x så många strålbox- och stråltriangelenheter.
Det finns också en dedikerad hårdvarustråltransformator som minskar behovet av att använda shader-instruktioner för att göra jobbet, vilket minimerar overhead för stråltraversering. Ett 128 KB minne i varje dubbel CU hjälper till att hålla strålstacken för effektiv push- och sorteringsoperation.
RDNA 4 introducerar konceptet med orienterade avgränsningsboxar (OBB) som anpassar BVH-avgränsningsboxar till geometrin och därmed minimerar falskt positiva strålinteraktioner i vad som annars bara är tomt utrymme i en box. AMD säger att detta tillvägagångssätt kan förbättra prestandan för ray traversal med så mycket som 10%.
Nytt för den här gången är också stöd för "relaxed out-of-order memory requests" som effektivt minskar väntetiden för vågor som inte har nått högnivåcachen tidigare. Detta förbättrar inte bara strålspårning utan även andra arbetsbelastningar.
I RDNA 4 kan shaders dynamiskt allokera register som gör det möjligt att ta emot fler vågor under flygning med förbättrad minneslatens.
Spårning av väg med RDNA 4
AMD-kort har kämpat med strålspårning i allmänhet, så spårning av vägar verkade inte vara aktuellt även med toppmoderna RDNA 3-kort. RDNA 4 syftar till att ändra på detta med stöd för neural radiance caching tillsammans med en ny neural supersampling och denoising-modell.
AMD har inte tillhandahållit exakta prestandasiffror för titlar med stöd för path tracing, men vi bör få en uppfattning när vi granskar dessa kort.
AI-funktioner som bygger på Radeon och Instinct
AMD säger att RDNA 4 har dedikerade matematiska pipelines för ML-acceleration med fokus på hög prestanda med smalare datatyper. Nytt för RDNA 4 är stöd för FP8 och BF8 för högpresterande inferens med hög precision.
AMD demonstrerade SDXL 1.5-bildgenerering och visade hur den RDNA 4-baserade Radeon RX 9070 XT erbjuder dubbelt så hög FP16-prestanda per CU jämfört med den RDNA 3-baserade RX 7900 XT.
RDNA 4:s nya AI-funktioner utnyttjas av FSR 4, som är en end-to-end pipeline som tränats på AMD:s GPU:er. FSR 4 använder FP8 för optimal användning av bandbredd, prestanda och kraft.
AMD visade upp till 3,7x fps-förbättringar med FSR 4 i kombination med frame interpolation och Radeon Anti-Lag med bibehållen hög bildkvalitet.
Källa(n)
AMD:s pressmeddelande