Nvidia GeForce GTX 680, la nuova architettura Kepler
Nvidia ha svelato la propria soluzione grafica GeForce GTX 680, nata per competere con la concorrenza nel segmento gaming high-end e basata sull'architettura Kepler.
La GeForce GTX 680 è la prima GPU Nvidia ad adottare un nuovo processo costruttivo e a sfruttare l'architettura Kepler. Il processore, noto come GK104 vanta numerose migliorie rispetto al top di gamma precedente, GeForce GTX 580, realizzato a partire dalla piattaforma Nvidia Fermi. Con l'arrivo di Kepler, il chip maker si appresta a rendere disponibili numerose altre declinazioni per il desktop, ma anche per il segmento mobile. A livello costruttivo, anche Nvidia passa al processo di lavorativo a 28 nm, una scelta operata da AMD già da alcuni mesi. Questa versione, destinata ai gamer più esigenti, si differenzia dai precedenti modelli di fascia alta, non solo per le prestazioni migliorate, ma anche per il netto incremento dell'efficienza energetica e per i consumi contenuti. La riduzione del processo produttivo ha consentito inoltre di incrementare la frequenza effettiva della GPU, che raggiunge ora i 1.006 MHz, un valore nettamente più alto rispetto ai 772 MHz del predecessore GTX 580. Ma le differenze non finiscono qui, la struttura accoglie il triplo degli stream processor, il doppio delle texture mapping unit e un bus verso le memorie a 256 bit. Ecco le specifiche e le relative differenze tra la precedente generazione "Fermi" e l'attuale "Kepler".Non solo, con la nuova piattaforma GK104, Nvidia ha scelto di equiparare la frequenza della GPU a quella degli stream processor, rinunciando all'approccio "double-speed processor clock", che prevedeva un clock di lavoro doppio rispetto a quello nominale della GPU. Con queste premesse, la nuova GPU si appresta ad affrontare la concorrenza, sempre più agguerrita, di AMD e delle recenti HD 79xx.
[tit:La piattaforma Kepler]Nvidia GeForce GTX 680 dispone di 1.536 Cuda Core e 8 PolyMorph Engines. Le unità ROPs sono 32, mentre le TMU salgono sino a 128. La memoria installata, di tipo GDDR5, vanta un data rate di 6.008 MHz e si interfaccia alla GPU tramite quattro controller dedicati a 64 bit. I 2 GByte di RAM possono dunque sfruttare un'ampiezza totale di 256 bit. In questo caso è possibile notare un approccio costruttivo e progettuale diverso rispetto ai predecessori GF110 e GF100, che facevano uso di un bus a 384 bit. La banda passante è particolarmente elevata e pari a 192 GBps.
Oltre alle novità sin qui analizzate, Kepler vanta un nuovo approccio a livello di architettura. Come AMD, anche Nvidia introduce la nuova generazione di processori grafici a partire da una piattaforma profondamente rimodellata, per soddisfare le esigenze degli applicativi, dei giochi e dei sistemi operativi moderni. Sfruttando come base le GPU Fermi, Nvidia ha ridisegnato le pipeline interne, sviluppando un engine di calcolo capace di sostenere un'elevata parallelizzazione delle operazioni e ottimizzata per la gestione delle operazioni di tassellazione e displacement mapping. Nello schema sono facilmente individuabili i quattro Graphics Processing Cluster.Osservando la struttura interna possiamo notare la disponibilità di diversi GPC o Graphics Processing Cluster, che costituiscono il fulcro del GigaThread Engine Nvidia. Questi elementi condividono una cache L2 da 512 KByte e si occupano delle operazioni di texturing, shading e della rasterizzazione. Ciascuno dei quattro GPC è costituito, a sua volta, da due moduli SMX (Streaming Multiprocessor), per un totale di otto. Per la GPU GK104, sono disponibili 192 Core CUDA per ogni comparto SMX, per un totale di 1.536. Ecco la struttura dei singoli moduli SMX, contenente le unità di calcolo, i core CUDA e 64 KByte di cache L1.I moduli SMX da 192 core rappresentano il nucleo principale che sta alla base delle prestazioni dei nuovi chip GeForce e consente di incorporare un numero molto più elevato di stream processor rispetto al passato. Una simile organizzazione assicura un'alta efficienza e scalabilità , oltre a performance superiori alla precedente soluzione Fermi. Questi elementi comprendono i nuclei compatibili CUDA, capaci di effettuare i calcoli relativi alla geometria, al pixel shading / vertex shading. Tesla, Fermi e Kepler a confronto.Oltre a questo, sono disponibili unità SFU (Special Function Units), per la gestione delle operazioni di interpolazione e il nuovo PolyMorph Engine 2.0, che dovrebbe assicurare prestazioni doppie rispetto alla passata generazione PolyMorph Engine.
[tit:Qualità , oltre alle prestazioni]Oltre alle maggiori prestazioni che è in grado di offrire, Nvidia GeForce GTX 680 vanta una migliorata qualità video, resa possibile dall'introduzione di alcuni algoritmi per la generazione delle immagini. Kepler offre due nuove modalità di antialiasing, funzione adottata per rimuovere gli artefatti dovuti alla rappresentazione a pixel, che può portare a bordi e contorni frastagliati negli oggetti 3D riprodotti. La prima modalità è definita TXAA che affianca alla classica tipologia AA multi-sampling, la possibilità di abbinare due schemi personalizzati TXAA e TXAA2. Oltre a offrire un elevato livello di dettaglio, Nvidia dichiara penalizzazioni in termini di velocità di calcolo decisamente inferiori. Per esempio TXAA2 dovrebbe garantire una qualità paragonabile alla modalità 16x MSAA, ma con un appesantimento nettamente più basso, paragonabile a quello che si potrebbe ottenere scegliendo un filtraggio 4x MSAA.
Kepler propone inoltre un nuovo encoder H.264 hardware, denominato NVENC, capace di ottimizzare i consumi e di liberare i core CUDA dalle operazioni di decodifica. Anche questa scelta progettuale è stato implementata per assicurare un balzo in avanti per quanto riguarda le performance, ma anche per garantire consumi moderati. L'uso dello specifico componente garantisce un encoding con velocità diverse volte superiori al tempo reale e permette di minimizzare i tempi di conversione. Questo encoder supporto i profili H.264 - 4.1 adottati nello standard Blu-ray e la gestione dei file stereoscopici grazie al protocollo MVC (Multiview Video Coding). Se adottato per le piattaforme di video editing, NVENC permette di incrementare la produttività con i software che lo supportano, come Cyberlink MediaEspresso.
[tit:Tecnologie per i gamer]Come abbiamo visto, Nvidia ha riprogettato la piattaforma Fermi, per raggiungere maggiori performance e qualità , oltre a consumi contenuti. Ma la famiglia di schede GeForce, da sempre destinata al gaming e agli utenti appassionati, offre molte caratteristiche uniche. Tra queste, il sistema Adaptive VSync destinato a incrementare la qualità video, soprattutto nella riproduzione di scene 3D calcolate in real time. Durante la generazione di ambienti grafici è infatti possibile incappare in quello che viene definito "screen tearing", un difetto visibile soprattutto quando le impostazioni dei giochi, o la potenza della scheda video, permettono la generazione di un elevato numero di fotogrammi al secondo. L'Adaptive VSync consente di eliminare i fastidiosi problemi di "tearing" e "stuttering".L'esubero di fps che vengono trasmessi a video deve però fare i conti con il refresh rate dello schermo, solitamente non superiore ai 60-75 Hz. La differenza tra l'elevato numero di frame generati e la limitazione video comporta la generazione di artefatti e difetti grafici (tearing), che peggiorano sensibilmente la qualità delle immagini. Per migliorare la definizione delle immagini, Nvidia introduce Adaptive VSync, che consente una variazione dinamica della sincronia verticale (VSync). Questo permette di abbattere il frame rate, evitando la "sovrapposizione" di più fotogrammi e di ridurre i problemi solitamente ravvisabili attivando il VSync tradizionale (stuttering).
Per garantire le massime performance Nvidia introduce il sistema GPU Boost, realizzato abbinando specifiche caratteristiche hardware del processore a un algoritmo di controllo software. Grazie infatti a una circuiteria dedicata saldata sulla board, è possibile ottenere una regolazione dinamica e completamente automatica della frequenza di lavoro. Questa piattaforma consente di incrementare le prestazioni solo quando richiesto dal sistema, senza mai superare i limiti di consumi pre-calcolati. Il sistema è strutturato per considerare come "base clock" la frequenza nativa della GPU di 1.006 MHz, punto di partenza per raggiungere il "boost clock", in funzione del TDP rilevato in un dato momento. Questo clock, che per la GTX 680 è di 1.058 MHz, viene calcolato a partire dal valore medio di variazione della frequenza che la singola GPU è in grado di garantire in uno scenario standard. Se, dunque, le risorse disponibili lo consentono, la board potrà , in autonomia, incrementare il clock, superando il valore intermedio e raggiungendo persino i 1.100 / 1.200 MHz. La funzione GPU Boost è integrata di serie nei nuovi processori, non è disattivabile e può essere modificata dall'utente, nel caso si desiderino maggiori performance. In alternativa, tramite l'opzione Frame Target, è possibile fissare manualmente il frame rate desiderato durante l'esecuzione di un titolo. In questo modo il meccanismo di controllo GPU Boost si occuperà di variare le frequenza per conseguire, laddove possibile, il risultato richiesto. Tra le migliorie introdotte con questa GPU, la possibilità di utilizzare sino a quattro monitor simultaneamente, sfruttando inoltre la funzionalità NVidia 3D Vision, per la visione stereoscopica e Nvidia Surround per l'utilizzo di tre display a 5.760x1.080 pixel. La board di riferimento comprende due output DVI-D/DVI-I, oltre a un'uscita HDMI e Display Port. Il produttore ha mantenuto naturalmente il supporto PhysX e la possibilità di realizzare configurazioni SLI, abbinando due o tre schede in un'unica configurazione PC.
[tit:Un'architettura efficiente]Con GeForce GTX 680 e la nuova infrastruttura Kepler, Nvidia propone un prodotto potente e altamente efficiente. La riprogettazione della struttura interna è infatti stata effettuata con particolare attenzione ai consumi generali e al rapporto performance/consumi. La scelta del chip maker rientra nei trend che possiamo osservare presso la quasi totalità degli sviluppatori di soluzioni e CPU/GPU. Se paragonata a GTX 580, la nuova GTX 680 risulta nettamente più efficiente.Nonostante la disponibilità di oltre 3,5 miliardi di transistor integrati, un valore comunque superiore ai 3 miliardi di GF110 (Fermi), Kepler ha un TDP di 195 W, nettamente più basso rispetto ai 244 W della precedente generazione. Nvidia ha sviluppato una piattaforma equilibrata, dove la potenza di calcolo per texture e shader è stata incrementata, bilanciando le operazioni di elaborazione dei rimanenti comparti. L'aumento delle capacità di calcolo dei componenti Special Function Units e Texture Mapping Unit ha permesso di adottare solo la metà dei moduli SMX, rispetto alle versioni Fermi GTX 580. Questo si traduce in un immediato risparmio energetico, pur garantendo la disponibilità di maggiori core CUDA e clock superiori. Lo scheduler interno è stato semplificato e reso più efficiente.Una ulteriore revisione dei blocchi funzionali di Kepler, rispetto a Fermi, riguarda le funzioni di scheduling. Al posto del complesso modulo adottato in precedenza, Nvidia è stata in grado di realizzare un sistema di pre-decodifica, capace di determinare le istruzioni da controllare e gestire, prendendo in considerazione la prevedibilità di determinate istruzioni che vengono richiamate a ciclo continuo. Considerando il consumo energetico bilanciato e la minore richieste di corrente, la nuova GTX 680 richiede solo due punti di alimentazione ausiliari a 6 pin e sfrutta un sistema di raffreddamento dual-slot relativamente contenuto. La board è infatti più corta delle concorrenti HD 7970/7950 e delle precedenti GTX 580, con una lunghezza di 255 mm.
Nel complesso si tratta di una soluzione ricca di funzioni e potenzialità , contraddistinta da una notevole attenzione per i consumi e da numerose caratteristiche destinate ai più attenti e ai gamer esigenti.
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con le notizie di BitCity.it iscriviti alla nostra Newsletter gratuita.