Pagina 2 di 11
Presentazione :
La Asus GeForce ENGTX295/2D/1792MD3/A, è la decima generazione di architettura per la famiglia di prodotti NVIDIA. Attualmente rappresenta il top di gamma di fascia alta ed è una delle più veloci soluzione video a singola scheda. Questo chip è costruito con tecnologia produttiva a 55 nanometri nella fonderia taiwanese TSMC. Il chip GT200b in totale integrata ben 1,4 miliardi di transistor, per una superficie complessiva del die quantificato in circa 470 millimetri quadrati.
La Asus GeForce ENGTX295/2D/1792MD3/A, è la decima generazione di architettura per la famiglia di prodotti NVIDIA. Attualmente rappresenta il top di gamma di fascia alta ed è una delle più veloci soluzione video a singola scheda. Questo chip è costruito con tecnologia produttiva a 55 nanometri nella fonderia taiwanese TSMC. Il chip GT200b in totale integrata ben 1,4 miliardi di transistor, per una superficie complessiva del die quantificato in circa 470 millimetri quadrati.
Il chip GT200b nella GTX295 è denominato ”GT200-105-B3”
Con la GPU GT200b NVIDIA ha preso spunto dall'architettura utilizzata nelle soluzioni G80 e G92, introducendo significative innovazioni ma mantenendo invariato il design di base. Troviamo 480 stream processors (SP) raggruppati a gruppi, indicati con il nome di “streaming multiprocessors (SM)”. Un gruppo di “streaming multiprocessore” viene indicato con il nome di “thread processing cluster o TPC”.
Riguardo all'architettura del GT200b, possiamo immediatamente capire come NVIDIA abbia suddiviso internamente le varie unità di elaborazione. Nella parte superiore della GPU trova posto la logica che gestisce la suddivisione dei vari thread all'interno dei core, accanto alle unità per il setup e la rasterizzazione.
I blocchi identici sono i TPC, all'interno dei quali sono chiaramente visibili le SM, ciascuna dotata di SP. Per ogni SM sono associate una unità di elaborazione full precision, indicata in colore verde nella parte superiore dell'SM, e due texture units distinguibili dal colore marrone. Ogni stream processor è capace di eseguire operazioni sia con interi che in virgola mobile, accedere alla memoria ed eseguire operazioni di logica. L'architettura è con pipeline multiple, in grado di eseguire una istruzione per ogni thread per ogni ciclo di clock.
Il file di registro locale interno ad ogni SM è stato raddoppiato rispetto a quello implementato nelle precedenti GPU G80 e G92; questo permette alla GPU GT200b di elaborare un numero maggiore di shader, o shader di più elevata complessità, senza necessità di eseguire swap verso la memoria con un conseguente impatto negativo sulle prestazioni.
Diverse ottimizzazioni, sono state apportate da parte di Nvidia all’interno alle special function unit interne agli SM, così da ottenere maggiore efficienza nell'utilizzo delle istruzioni in virgola mobile MUL. In particolare ogni stream processor può elaborare quasi a piena velocità due operazioni di tipo MAD (Multiply-Add) e una di tipo MUL, utilizzando l'unità MAD integrata nello stream processor per eseguire un MUL e un ADD per ogni ciclo di clock, accanto all'unità SFU che esegue una seconda operazione MUL. Abbiamo detto che all'interno di ogni SM sia presente una unità di calcolo double precision. Nvidia ha infatti implementato nelle GPU GT200b anche questa funzionalità, particolarmente importante soprattutto quando la GPU viene utilizzata per elaborazioni di GPU Computing, ovvero per calcoli paralleli tipicamente delegati alla cpu, grazie alla nuova tecnologia “CUDA”, che vedremo ed analizzeremo in seguito. Le ROPs possono operare con un output massimo di 28 pixel per clock, per ciascuna delle partizioni; nello schema di 28 ROPs vogliono dire 28 pixel per clock in output e 28 pixel per clock in blend: le nuove unità, infatti, possono eseguire blend a velocità doppia .Pertanto abbiamo 28x2 ROPs.
Uno dei principali limiti delle precedenti soluzioni Nvidia erano da ricercarsi nelle prestazioni con geometry shader. NVIDIA è intervenuta in GT200b per migliorare sensibilmente questo elemento architetturale, portando ad un incremento di 6 volte dei buffer di output interni alla GPU. Infatti sono presenti varie ottimizzazioni minori all'interno della GPU; il protocollo di comunicazione è stato migliorato così da incrementare l'efficienza nelle trasmissioni tra il driver e il front end.
La Asus GeForce ENGTX295/2D/1792MD3/A ha frequenza di clock è pari a 576 MHz. Nel GTX 295 troviamo l'utilizzo di moduli di memoria GDDR3, con un bus a 448 bit di ampiezza e frequenza di funzionamento pari a 2.000 Mhz, che porta l'ampiezza della banda di memori a ben 220 GB/s.
Con la GPU GT200b NVIDIA ha preso spunto dall'architettura utilizzata nelle soluzioni G80 e G92, introducendo significative innovazioni ma mantenendo invariato il design di base. Troviamo 480 stream processors (SP) raggruppati a gruppi, indicati con il nome di “streaming multiprocessors (SM)”. Un gruppo di “streaming multiprocessore” viene indicato con il nome di “thread processing cluster o TPC”.
Riguardo all'architettura del GT200b, possiamo immediatamente capire come NVIDIA abbia suddiviso internamente le varie unità di elaborazione. Nella parte superiore della GPU trova posto la logica che gestisce la suddivisione dei vari thread all'interno dei core, accanto alle unità per il setup e la rasterizzazione.
I blocchi identici sono i TPC, all'interno dei quali sono chiaramente visibili le SM, ciascuna dotata di SP. Per ogni SM sono associate una unità di elaborazione full precision, indicata in colore verde nella parte superiore dell'SM, e due texture units distinguibili dal colore marrone. Ogni stream processor è capace di eseguire operazioni sia con interi che in virgola mobile, accedere alla memoria ed eseguire operazioni di logica. L'architettura è con pipeline multiple, in grado di eseguire una istruzione per ogni thread per ogni ciclo di clock.
Il file di registro locale interno ad ogni SM è stato raddoppiato rispetto a quello implementato nelle precedenti GPU G80 e G92; questo permette alla GPU GT200b di elaborare un numero maggiore di shader, o shader di più elevata complessità, senza necessità di eseguire swap verso la memoria con un conseguente impatto negativo sulle prestazioni.
Diverse ottimizzazioni, sono state apportate da parte di Nvidia all’interno alle special function unit interne agli SM, così da ottenere maggiore efficienza nell'utilizzo delle istruzioni in virgola mobile MUL. In particolare ogni stream processor può elaborare quasi a piena velocità due operazioni di tipo MAD (Multiply-Add) e una di tipo MUL, utilizzando l'unità MAD integrata nello stream processor per eseguire un MUL e un ADD per ogni ciclo di clock, accanto all'unità SFU che esegue una seconda operazione MUL. Abbiamo detto che all'interno di ogni SM sia presente una unità di calcolo double precision. Nvidia ha infatti implementato nelle GPU GT200b anche questa funzionalità, particolarmente importante soprattutto quando la GPU viene utilizzata per elaborazioni di GPU Computing, ovvero per calcoli paralleli tipicamente delegati alla cpu, grazie alla nuova tecnologia “CUDA”, che vedremo ed analizzeremo in seguito. Le ROPs possono operare con un output massimo di 28 pixel per clock, per ciascuna delle partizioni; nello schema di 28 ROPs vogliono dire 28 pixel per clock in output e 28 pixel per clock in blend: le nuove unità, infatti, possono eseguire blend a velocità doppia .Pertanto abbiamo 28x2 ROPs.
Uno dei principali limiti delle precedenti soluzioni Nvidia erano da ricercarsi nelle prestazioni con geometry shader. NVIDIA è intervenuta in GT200b per migliorare sensibilmente questo elemento architetturale, portando ad un incremento di 6 volte dei buffer di output interni alla GPU. Infatti sono presenti varie ottimizzazioni minori all'interno della GPU; il protocollo di comunicazione è stato migliorato così da incrementare l'efficienza nelle trasmissioni tra il driver e il front end.
La Asus GeForce ENGTX295/2D/1792MD3/A ha frequenza di clock è pari a 576 MHz. Nel GTX 295 troviamo l'utilizzo di moduli di memoria GDDR3, con un bus a 448 bit di ampiezza e frequenza di funzionamento pari a 2.000 Mhz, che porta l'ampiezza della banda di memori a ben 220 GB/s.
Si noti, come il programma GPU-Z e GPU Caps Viewer riconoscano in maniera esatta, tutte le caratteristiche della GPU.
I chip memoria , “14 moduli da 64 MB ciascuno”, sono disposti su i due lati del PCB della scheda video di colore nero.
I chip memoria , “14 moduli da 64 MB ciascuno”, sono disposti su i due lati del PCB della scheda video di colore nero.
La soluzione Asus GeForce GTX295 integra 1792 Mbyte di memoria video di tipo DDR3. Questo valore dovrebbero permettere di sfruttare al meglio risoluzioni video molto elevate “oltre i 1920x1200” , in abbinamento ai giochi particolarmente esigenti in termini di dotazione massima di memoria, evitando che i frames al secondo vengano fortemente penalizzati. Il bus è il solito PCI Express 16X 2.0. Sul retro della scheda sono presenti le connessioni con cui NVIDIA ha sviluppato la scheda reference . Oltre alle due classiche e immancabili DVI, è stata affiancata una HDMI. Ovviamente, il design reference rappresenta la base di partenza per ogni partner, a cui ogni produttore può apportare sostanziali modifiche.
Le dimensioni della soluzione di Nvidia non differiscono da una classica GTX280, anche se, rispetto a quest'ultima, per ovvi motivi, il peso risulta essere considerevolmente superiore. L'alimentazione rimane identica, sono infatti necessari due connettori, uno a sei e uno a poli per consentire il corretto funzionamento della scheda.