nVidia annuncia la nuova famiglia di prodotti:
GeForce GTX 200. Nello specifico sono stati attualmente presentati due modelli,
GeForce GTX 280, al momento posizionata al top di gamma, e
GeForce GTX 260, con specifiche inferiori. Entrambe le schede sfrutta la nuova architettura di base, che si caratterizza per le performance notevolmente superiori rispetto alle generazioni GeForce 88xx, per il supporto nativo DirectX 10 (non DirectX 10.1) e per la migliorata capacità di supportare e gestire calcoli fisici per incrementare il realismo nei giochi, ma anche negli applicativi professionali.
Si tratta dunque di una nuova generazione
fortemente improntata verso il pubblico di videogiocatori esigenti e per chi desidera il massimo della tecnologia oggi disponibile. Tuttavia, il supporto per la
piattaforma CUDA e le capacità di calcolo del processore incentivano notevolmente quel processo, in atto già da tempo, per la transizione delle operazioni di calcolo, dalle CPU alle GPU. L'utilizzo di
GP-GPU (General Purpose-GPU) permette di incrementare in modo
esponenziale le prestazioni dei sistemi di calcolo, laddove è richiesta una precisione elevata e dove siano disponibili enormi moli di dati da calcolare. àˆ il caso degli ambienti dove viene effettuata ricerca medica, oppure il calcolo in ambito CAE e in generale l'elaborazione audio/video ad alti livelli.
nVidia traccia la strada per incrementare le prestazioni in ambito
videoludico e professionale, decentrando il carico di lavoro dai microprocessori centrali delle architettura attuali, ai processori video, ora capaci di maggiore potenza, grazie alla
scalabilità e alla presenza di
più core.
[tit:Architettura]
GeForce GTX 200 fa uso di un'architettura di nuova generazione, capace di incrementare le performance generali di un
fattore 1,5x rispetto alle precedenti
GPU serie 8 e 9. Il chip è realizzato con un processo a
65 nm (TSMC) e incorpora circa
1,4 miliardi di transistor, che lo rendono il processore grafico più complesso oggi disponibile. Nonostante questo nVidia ha curato in modo particolare l'aspetto dei consumi energetici e la gestione degli stati di utilizzo dei comparti interni. L'intero sistema interno SPA (Scalable Processor Array), che era alla base della prima generazione di GPU della famiglia GeForce 8xxx e 9xxx, è stato ridisegnato per ottenere una seconda generazione più flessibile e potente.
Di fatto, rispetto alle architetture G80 e G92, sono stati incrementati in modo significativo il numero di Texture Processing Cluster e quello degli Stream Multiprocessor. L'aumento di questi parametri, tra loro direttamente correlati, definisce un incremento di Streaming Processor, fino a ben 240 core effettivi.
Chip
TPC
SM per TPC
SP per SM
SP Totali
GeForce serie 8 e 9
8
2
8
128
GeForce serie GTX 200
10
3
8
240
[tit:Multi-core]
L'elevato numero di core disponibili permette già di capire immediatamente i vantaggi legati all'utilizzo delle GPU per l'esecuzione di molti dei compiti deputati alle CPU, dotate solitamente di uno, due o quattro core. GeForce GTX 200 è stato progettato per poter assolvere indistintamente operazioni grafiche o di calcolo intensivo. Ciascuno dei 10 Texture Processing Cluster (TPC) include tre Streaming Processor, che a sua volta dispone di 24 processing core. In questo modo si ottengono i 240 core scalari, che possono essere indirizzati in base all'utilizzo specifico.
Nell'utilizzo in "modalità grafica" il processore riceve e distribuisce i calcoli da eseguire tramite lo shader thread dispatch, che lavora assieme alle unità di setup e di raster. Successivamente all'elaborazione effettuata dai core integrati, lo stream delle informazioni viene gestito dal processore ROP e inviato alla memoria tramite le memory interface unit.
Sfruttando invece
"l'architettura di calcolo parallelo" si utilizza il thread scheduler hardware per smistare i dati tra i diversi TPC. I singoli moduli includono la texture cache e le unità di interfacciamento alla memoria.
La presenza della cache consente di migliorare l'efficienza nelle operazioni di accesso alla memoria e permette di mantenere una maggiore banda in fase di lettura/scrittura. Con l'indicazione "
Atomic" nel diagramma si intende la possibilità di intervento granulare nelle singole aree di memoria (lettura, modifica e scrittura), al fine di migliorare la gestione della struttura e il controllo dei dati.
In generale, grazie a una struttura che utilizza due modelli di calcolo differenti (MIMD e SIMT) è possibile gestire fino a 30.720 thread contemporaneamente. Grazie al sistema di scheduling hardware è inoltre possibile ottenere un utilizzo quasi prossimo al 100% di ogni core, sfruttando la possibilità di accodare i thread in attesa senza "costi aggiuntivi" in termini di tempo per la GPU.
[tit:Novità ]
Oltre a quanto sinora descritto,
GeForce GTX 200 implementa notevoli altre novità . Tra queste il supporto per un file di registro più ampio rispetto alle generazioni precedenti, che permette di gestire al meglio le istruzioni Shader, anche particolarmente lunghe. Questo garantisce maggior velocità di esecuzione ed esclude la possibilità che il sistema possa esaurire la memoria e richiederne ulteriore in modalità swap. Dunque la possibilità di gestire shader più complessi permette di realizzare giochi più verosimili e scenari fotorealistici calcolati in tempo reale.
Il demo proprietario "Medusa" ripropone scenari complessi e credibili.Sono inoltre state migliorate e ottimizzate una serie di
"Special Function Unit" (SFU) interne agli SM, capaci di incrementare l'efficienza dei calcoli in virgola mobile "MUL". Nel dettaglio, nVidia dichiara una velocità di elaborazione quasi "real-time" per l'esecuzione di due operazioni di tipo MAD (Multiply-Add) e una MUL. Il risultato conseguito è di circa 933 Gigaflops di picco per ciascun Stream Processor, lavorando in virgola mobile e in modalità single precision, con un efficienza superiore al 90%.
La nuova architettura beneficia inoltre di un sistema di calcolo a
doppia precisione a 64 bit in floating point. Questo si traduce come beneficio diretto per le applicazioni di calcolo intensivo, come ad esempio, l'elaborazione dati ad alto livello di tipo finanziario e scientifico. nVidia ha inoltre migliorato le performance relative al sistema di Texturing, con un massimo di
80 pixel per clock con applicazione di bilinear texture e capacità di inserimento filtraggi, rispetto ai 64 pixel per clock di GeForce 9800 GTX. Le migliorie riguardano anche il sottosistema ROP, in grado di supportare gli schemi di antialias delle precedenti generazioni GeForce, ma capace ora di un massimo di 32 pixel per clock e una possibilità di blending doppia rispetto a GeForce serie 8 e 9.
La potenza delle nuova GPU e le numerose innovazioni a livello di architettura garantiscono un output di alto livello.Le prestazioni di Geometry Shading e quelle relative allo streming in uscita sono state incrementate di circa sei volte, rimuovendo così uno dei colli di bottiglia nel calcolo degli Shader. L'interfaccia di accesso alle memorie passa dai 384 bit delle soluzioni top di gamma precedenti, ai 512 bit attuali, tramite otto unità di interfacciamento a 64 bit ciascuna, aumentando la banda passante di picco fino a 141,7 GByte/s.
[tit:Le schede]
In questa occasione nVidia annuncia due schede grafiche GeForce GTX 280 e 260, entrambe comunque orientate verso il mercato dei videogiocatori entusiasti.
Le due schede sfruttano la medesima tecnologia, ma GeForce GTX 280 rappresenta il top di gamma, con soluzioni estreme e frequenze di oltre 600 MHz per il core e 2,2 GHz per le memorie. Inoltre la memoria ammonta a 1 GByte e l'accesso alla memoria è garantito da un bus a 512 bit. GeForce GTX 260 è dotata invece di 896 MByte di RAM e sfrutta un bus a 448 bit, capace di un banda passante di 111,9 Gbyte/s. Le frequenze operative sono leggermente più basse, come anche il numero di unità ROP, 28 contro le 32 del modello più potente.
GPU
GTX 280
GTX 260
Processo costruttivo
65 nm
65 nm
Numero di transistor
1,4 Miliardi
1,4 Miliardi
Clock GPU
602 MHz
576 MHz
Clock Shader
1.296 MHz
1.242 MHz
Numero di Core
240
192
Frequenza Memorie
2.214 MHz
1.998 MHz
Interfaccia Memorie
512 bit
448 bit
Banda passante
141,8 GByte/s
111,9 GByte/s
Memoria installata
1 GByte
896 MByte
ROPs
32
28
Texture Unit
80
64
Texture Fill Rate
48,2 GTexel/s
36,9 GTexel/s
HDCP
sì
sì
HDMI Support
sì / con adattatore
sì / con adattatore
Connettori
2x DVI / 1x HDTV
2x DVI / 1x HDTV
RAMDAC
400 MHz
400 MHz
Bus
PCI Express x16 2.0
PCI Express x16 2.0
[tit:Differenze e analogie]
Esteticamente le due board hanno dimensioni e formati analoghi, con un dissipatore che racchiude l'intera scheda e permette di convogliare l'aria verso l'esterno del case. Questa soluzione occupa due slot e fa uso di una grossa e silenziosa ventola tachimetrica termoregolata. L'adozione di questo sistema di raffreddamento consente valori di temperatura
ottimali anche sotto carico, grazie all'aspirazione dell'aria dall'intero del case e l'espulsione sul retro, al di fuori del sistema. I processori sono comunque progettati per funzionare a un massimo di
105° in condizioni estreme, temperatura oltre la quale subentra il sistema di
spegnimento automatico.
GPU
GTX 280
GTX 260
Form Factor
Dual Slot
Dual Slot
Connettori alimentazione
1x 8 pin + 1x 6 pin
2x 6 pin
Potenza massima assorbita
236 W
182 W
Limite termico GPU
105°
105°
Entrambe le schede richiedono due punti di alimentazione, ma in particolare GeForce GTX 280 necessita di un alimentatore dotato di prese a 6 e 8 pin, mentre GTX 260 dispone di due connettori a 6 pin PCI Express. Il consumo complessivo delle due schede è di 236 W e 182 W, rispettivamente per il modello più veloce GTX 280 e per GTX 260. Per alimentare a dovere queste schede nVidia consiglia un alimentatore da almeno 550 W, ma capace di erogare una corrente di 40 A sulla linea 12 V, un requisito non certo alla portata di tutti gli alimentatori oggi in commercio.
[tit:HybridPower Technology]
nVidia consolida il sistema di powersaving
HybridPower Technology, che permette un consistente risparmio energetico quando non sono richieste elevate prestazioni per il calcolo di complesse scene 3D.
La piattaforma sfrutta una motherboard compatibile che disponga di un sottosistema grafico e capace di accogliere una scheda addizionale con grafica discreta, come per esempio i modelli con chipset nVidia 780a. Quando il carico di elaborazioni è minimo, come per esempio nella normale attività lavorativa, nella navigazione Internet o nella riproduzione di un film, il sistema grafico di tipo discreto
viene spento, per un consumo effettivo nullo. Se le richieste in termini di prestazioni salgono, la piattaforma si occupa di utilizzare la maggiore potenza offerta dalla scheda aggiuntiva. Questo avviene grazie al controllo software via driver e ai cosiddetti "watchdog" che monitorizzano il sistema istante per istante. Viene tenuta traccia del traffico interno alla GPU e, in caso di necessità , viene attivata la sezione con grafica discreta, in modo continuo, trasparente all'utente e senza lo scambio di connettori tra le due GPU.
Per quanto riguarda un utilizzo generico del sistema, nVidia dichiara consumi di circa 25 W in modalità Idle e di 35 W durante la riproduzione di film DVD / Blu-ray.