Larchitettura dei Radeon HD 5800

Diamo uno sguardo in dettaglio all'architettura dei nuovi processori grafici Radeon HD 5800 di Ati, i primi a supportare DirectX 11.

Autore: Redazione Technology

Amd ha presentato la nuova famiglia di processori grafici Radeon HD 5800 che per ora annovera due modelli siglati rispettivamente HD 5850 e HD 5870.
Non si tratta questa volta di uno “shrink”, cioè di un ridimensionamento del chip legato al processo produttivo, ma dell'introduzione di una nuova architettura che introduce diversi miglioramenti rispetto alla generazione precedente, primo fra tutti il supporto per DirectX 11. Vediamo le caratteristiche di questo nuovo componente

[tit:Come sono fatti i nuovi Radeon]
Radeon HD 5800 si basa sull'architettura Terascale 2, che in pratica raddoppia le prestazioni rispetto alla precedente raggiungendo i 20 Gpixel/s e oltre i 2 TeraFlops.


Molte delle caratteristiche sono state migliorate rispetto al passato, in aspetti come per esempio il motore grafico, le unità  Stream, il set di istruzioni, ma anche il layout Simd, le unità  per le texture, i back end per il render e i controller per i display.
Le Gpu della famiglia HD 5800 sono costruite con un processo produttivo a 40 nanometri e l'HD 5870 può contare su 2,15 miliardi di transistor per un'area del silicio di 334 millimetri quadrati. Per fare un confronto con la precedente generazione, il Radeon HD 4870 aveva 956 milioni di transistor e un'area del die di 263 millimetri quadrati. Per i consumi sono stati fatti dei buoni progressi. Se, infatti, la scheda con il Radeon HD 4870 consumava 160 W alla massima potenza e 90 W in idle, ora con il Radeon HD 5870 questi valori sono rispettivamente di 188 W e 27 W (170 W e 27 W per l'HD 5850).  A fronte di un incremento della potenza massima, si può notare quindi una sensibile riduzione della potenza dissipata in modalità  idle.
Sul versante delle frequenze operative, il Radeon HD 5850 opera a 725 MHz per il core a 1.000 MHz per la memoria, valori che salgono rispettivamente a 850 MHz e 1.200 MHz per il Radeon HD 5870. Analogamente per le prestazioni, Amd dichiara ben 2,7 Tflop per l'HD 5870 e 2,09 per l'HD5850, mentre per il texture fillrate, i valori sono rispettivamente di 52,2 e 68 Gtexel/s. Il pixel fillrate, invece, raggiunge i 23,2 Gpixel/s e, nel modello più potente, i 27,2 Gpixel/s.


Per quanto riguarda gli z/stencil, Amd dichiara 92,8 Gsample/s per l'HD 5850 e 108,8 per il 5870.
Dal punto di vista dell'architettura, modello di punta, il Radeon HD 5870, dispone 20 unità  Simd, ciascuna con 16 thread processor che, a loro volta, dispongono di 5 core Stream. In totale ci sono quindi 1600 core Stream per l'elaborazione (l'HD 5850 ne ha 1440 in totale). A questo si aggiungono 80 unità  per le texture (72 per l'HD 5850), quindi quattro per ogni motore Simd. L'interfaccia per la memoria Gddr5 è in grado di superare i 150 Gbyte/s nell'HD 5870 e 128 GByte/S nell'HD 5850.
Diamo ora uno sguardo in dettaglio ai componenti dell'architettura.

[tit:L'engine grafico]
Dal punto di vista dell'architettura interna, il motore grafico delle Gpu HD 5800 dispone di due unità  per la rasterizzazione e una nuova unità  per le operazioni di tessellation.


Questa nuova unità  utilizza una tecnologia di sesta generazione è programmabile attraverso gli Hull & Domain shader delle DirectX11. Il motore grafico utilizza, inoltre, un nuovo algoritmo per ridurre gli artefatti e le funzioni di interpolazione si appoggiano sulle DirectX11. Di fatto vengono utilizzate nuove istruzioni per gli stream processor per le funzioni di interpolazione.
Dal punto di vista delle prestazioni, sono state migliorati alcuni aspetti per l'aggiornamento costante dei buffer e lo shading per la geometria è stato reso più veloce. Analogamente vanno segnalati dei miglioramenti per l'OpenGL con incrementi nelle operazioni di line rendering e clipping.

[tit:I thread processor e le texture unit]
Parte delle prestazioni di questo nuovo componente dipendono dai thread processor che permettono di raggiungere complessivamente 2,7 Tflop per operazioni in singola precisione e 544 GigaFlop per quelle in doppia precisione. Di fatto è stato incrementato il numero di istruzioni elaborabili per ogni ciclo di clock e il sistema supporta completamente in hardware il DirectCompute 11 el'OpenCL 1.0.
      

Ogni thread processor è composto da 4 core stream, più un altro dedicato a funzioni speciali, dalla branch unit e dai registri general purpose. Si tratta quindi di un'unità  di elaborazione piuttosto complessa. Anche le texture unit sono state modificate, in modo da portare le performance di questa sezione a valori come 68 miliardi di texel bilineari filtrati al secondo e fino a 272 miliardi di fetches a 32 bit al secondo.

Grazie alle nuove funzioni delle DirectX 11 per le texture, si possono raggiungere definizioni di 16k x 16k e sfruttare le funzionalità  di compressione dei blocchi HDR a 32 e 64 bit (BC6 e 7).La cache inoltre è stata raddoppiata passando a 128 Kbyte per memory controller.Anche per le cache comunque è stata aumentata la larghezza di banda che arriva sino a 1 Tbyte/s per il texture fetch e fino a 435 Gbyte/s tra cache al primo livello e quella al secondo livello.

[tit:Gli altri elementi]
Per esempio è stato implementato un nuovo algoritmo per il filtraggio anisotropico che non condiziona le prestazioni come accadeva invece in passato. Altra caratteristica di questa sezione consiste nell'eliminazione della dipendenza dagli angoli.
I back end di rendering possono contare ora su nuove tecnologie. Per esempio le texture unit possono leggere i buffer colore compressi AA. Sono state migliorate le prestazioni anche del Custom filter AA e incrementato il sample rate, mentre il supersample AA si basa sulla tecnologia Adaptive anti aliasing che permette di mantenere un'efficienza piuttosto lineare con i vari giochi. Questo permette, in molti casi, di ottenere prestazioni praticamente doppie rispetto a quelle dei Radeon della serie HD 4800.
Un altro elemento fondamentale per le prestazioni della nuova generazione di Gpu Ati è quella dedicata all'interfacciamento con la memoria.

Le tecnologie utilizzate in questa sezione sono numerose. Per esempio, è stato implementato un sistema Ecd (Error detection code) che verifica il Crc dei dati durante i trasferimenti per migliorare l'affidabilità  con le frequenze di clock più elevate. à‰ stato implementato anche un sistema compensazione del clock sensibile alla temperature, cosa che ha permesso alla velocità  di avvicinarsi ai 5 Gbps. Il sistema inoltre permette di modificare le frequenze di clock e la tensione in modo dinamico senza perdite di prestazioni. Anche la gestione dell'alimentazione della scheda è comunque dinamico, visto che dispone di una sezione hardware che rileva costantemente le temperature dei regolatori di tensione per prevenire i surriscaldamenti. A questo si aggiunge la modalità  ultra low power state in caso di configurazioni multi gpu.

Visualizza la versione completa sul sito

Informativa
Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, acconsenti all’uso dei cookie.